巡天数据探索入门:(二)通过Python访问数据

原创 梁晨 发表于Lcsky.org

巡天数据是不是只有科学家才能访问?——并不是。其实,科学家想了很多办法,希望能让每一个感兴趣的人都能访问、使用这些数据,只是因为这些数据过于庞大、复杂,是一道巨大的知识的鸿沟,阻隔在普通人和专业人员之间。

带着这样一个问题:恒星距离我们多远?我们来看看如何利用巡天数据扩展自己的认知。

编程是一个非常强大的工具,让我们能以前所未有的效率来使用数据。Python是一个在数据分析领域简单易用,也很强大的语言,Python下的开源库astroquery,集成了大部分巡天数据的访问方式,我们可以用几行代码就“撬动地球”。

并非所有的巡天任务都关注恒星的距离,上一篇文章介绍的Gaia卫星,正好能提供高精度的位置、距离、自行信息。我们就用astroquery.gaia模块,使用Gaia卫星数据,来开启这个探索之旅。

通过Python调用astroquery.gaia模块,使用ADQLgaiadr3.gaia_source_lite表查询距离我们最近的100颗恒星,就是下面的5行代码,提交到Gaia服务器运行大概6秒就能得到结果,ADQL的语法和SQL非常相似:

1
2
3
4
5
select top 100
*
from gaiadr3.gaia_source_lite
where parallax > 0
order by parallax desc

完整的代码在这里下载,运行结果是这样的:

从距离分布直方图可以看出,距离我们最近的恒星大概4光年远,还有一颗在大约6光年附近。从下面的表格中,它们分别是source_id=5853498713190525696,它就是大名鼎鼎的毗邻星c,以及source_id=4472832130942575872,搜索source_id发现它是巴纳德星b

巡天数据探索入门:(一)几个著名的巡天计划

原创 梁晨 发表于Lcsky.org

前言

对星空的好奇心,一直存在于内心,但大部分只是转化成了深空天体摄影的具体实践。

我一直问自己,在专业天文学家和设备能力超过业余设备多个数量级的情况下,我们孜孜不倦的去拍这些目标,到底有什么意义?

现在,这个问题的答案暂时是这样:

  1. 正是观测实践,培养了我早期的工程素养、认知能力和自驱力

  2. 除此之外,确实没有更深刻的意义,以至于一次和朋友Scott聊天时,他知道我一直喜欢天文,和我讨论本星系群、可观测宇宙时,我竟然是第一次听说这些概念,也第一次意识到,我们满天繁星,竟然全都是银河系内的恒星

  3. 如果只是拍摄,我不会取得超过1838年,贝塞尔利用周年视差测定出恒星的距离更深入的认知

  4. 有没有一些更接近现代科学认知的实践方式呢?还真有,很多巡天项目的数据都是可以公开获取的,我们可以通过编程进行数据科学的实践!

我计划把这个探索过程,写下来,和大家分享这些有意思的数据和分析方式。

LAMOST-郭守敬望远镜光谱巡天

TODO:

斯隆数字巡天-SDSS

数字巡天项目的鼻祖,由位于美国的阿帕契点天文台(北天)和位于智利的拉斯坎帕纳斯天文台(南天)组成,从2000年开始的第1阶段,到现在已经进行到第5阶段,每一个阶段会专注于不同的关注点,改造或引入新的设备,也会有不同的收获。

目前正在进行的是第5阶段巡天(SDSS-V),关注点主要是银河系、本星系群、黑洞。

Image Credit: M. Seibert (OCIS) & the SDSS-V team

目前共记录到天体数量(来源:维基百科)

种类 个数
星系 790,220
类星体 (z <2.3) 89,458
类星体 (z ≥2.3) 12,892
M型和更晚型的恒星 64,895
其他恒星 126,351
天空光谱 59,843
待确认天体 19,861

第17次数据发布-DR17

2021-12-6日的第17次数据发布,包含以下数据集,原版网页上还有大量详细的信息可以点击查看:

  1. 银河系演化调查 - APOGEE-2 (2014-2021)
  • 包含65.7万颗恒星的近红外光谱(1.51~1.70um),这个波段能够透过星际尘埃阻挡,看清银河系各个方向的恒星。提供了银河系恒星的元素丰度分布和整个银河系不同位置恒星的动态运动信息。

  • 关键词:【恒星】【银河系内】【红外光谱】

  1. 近邻星系空间光谱调查 - MaNGA 详情 (2014-2020)
  • 和之前只由一跟光纤获取信息中心的光谱不同,MaNGA有17个场积分单元IFUs用于拍摄星系光谱,IFUs由一组蜂窝状的多根光纤组成,能同时获取信息不同位置的光谱,进而得到丰富的空间结构信息。

  • 包含大约1万个临近的河外星系。

  • 数据获取、处理方式、各字段含义详见Bundy等人2015年的论文

  • 关键词:【近邻星系】【二维空间光谱】

  • 使用python分析的入门实践

  1. 近邻星系恒星星表 - MaStar (2014-2020)
  • 大约1万颗恒星的高质量光谱(362.2~1035.4nm),选择恒星的原则是均匀并且充分的覆盖恒星参数空间(有效温度Teff、表面重力log(g)、铁氢比[Fe/H]、α合成元素丰度与铁元素丰度[α/Fe])。

  • 数据获取、处理方式、各字段含义详见Yan等人2019年的论文

  1. 宇宙历史的关键早期阶段调查 - BOSS

  2. 银河系探索和调查 - SEGUE (2004-2009)

  • 用于帮助人类理解和探索银河系,分两期,分别记录了23万和11.9万颗恒星光谱(河内恒星总数约2000亿颗)。
  1. 大面积多目标恒星视向速度调查 - MARVELS (2008-2014)
  • 这个数据集包含了1.1万颗明亮恒星的径向速度,其速度精度和时间分辨率足以探测到轨道周期从几小时到两年不等的气态巨行星。

  • 关键词:【恒星】【多次重复观测】【时间分辨率】

数据访问方式

  1. 下载

  2. SkyServer - 一组在线工具,在页面上查看SDSS的图片、光谱、恒星参数等信息。

  3. SciServer - jupyter - 提供了一个免费的jupyter-lab环境,可以通过python读取和分析数据,不需要把几百G的数据拖回来分析了。

Gaia-盖亚空间望远镜

盖亚(Gaia)是欧洲空间局的空间望远镜,于2013年12月19日发射,运行在地球轨道的 L2 拉格朗日点附近。

该任务的目的是要绘制一个包含约10亿颗或银河系1%恒星的三维星图,精度能达到约20uas(微角秒)

Erik Tollerud写了一个开源的notebook,可视化了我们附近恒星的周年视差。

相隔14年,又一次更新网站的系统

原创 梁晨 发表于Lcsky.org

回想起2008年,那个还在大学的日子,换上drupal与初中时代的站点告别,今天的这个深夜,仿佛跨越时空,和2008年形成了一个单向的、只可观测的连接。

为什么抛弃了drupal/wordpress?被不停的升级、兼容性问题困扰,我回头思考几个问题:

  1. 真的需要一个后端吗?
  • 其实并不需要,至少,在展现的这一侧,并不需要。文章的管理,和对外展现,可以是分离的。
  1. markdown这么香,为什么还在用rich editor?
  • git + markdown 才是正道啊,rich editor是远古洪荒时期的产物了。
  1. 三体中,罗辑在冥王星上建立地球文明博物馆,试图在10亿年这样的尺度保存人类文明,一切高级的介质在时间面前都苍白无力,最终他的选择是:把字刻在石头上,嗯,从这个角度来看,静态网页有几分神似了。
  • 其实,不用10亿年,仅仅14年,就已经明显看得出软件世界的变迁带来的问题,去年已经差点连https证书都签不出来了,而各种细节的体验,例如移动端/视频等等,也停留在那个特定的历史时期,这才感慨,软件的世界也有新陈代谢,曾经同时代的站点已经在慢慢消逝。

所以,hexo + hexo admin是一个再合适不过的选择,天然的markdown支持,一键编译成静态页面,rsync同步到远端。

就是这样了,有很多感悟,有一些新的认知,这段旅程的记录在这里继续吧。

2021年总结

原创 梁晨 发表于Lcsky.org

今年搬了新家,有了一个视野还算开阔的阳台,每一个晴朗的夜晚都可以半自动积累曝光,这是极好的。尝试了KStars+Ekos控制阳台上的树梅派+INDI的方式,真是非常惬意。

独自与星空相处,感受内心的平静,回看这12年的时光,惋惜于自己的傲慢与无知,06年第一次在红土地拍出真正的银河,那竟然是第一次有机会使用赤道仪,我就是这样,想得太多,做的太少,但绝大部分的事物,不去体验,是不会有进一步的认知的。

有的时候就是需要一些浪费的,把时间和资源浪费在美好的事物上,给自己和这些美好的事物一些成长的空间,总比碌碌无为要好得多。别动不动就想着改变世界,别总是自责时光的逝去,过于精致和谨小慎微都会让人碌碌无为,你越是不想浪费一分一秒,就越是变得急功近利。资本,也绝对不是人类已知最高效的方式。这并非从一个极端走向另一个极端,恰恰是要避免极端,因为绝对的杜绝浪费,其实是很高的自我要求和自我定位,会让人不屑于去做一些小事,对机会成本的患得患失,会让人原地踏步不敢前行,最后致命的“无意义”感会把人拖向深渊。

慢下来,允许一些浪费,承认有些事情自己做不到,对自己和同伴都宽容一些,才是长远的事物可以萌发的土壤。

我对损耗的认知是有偏差的,这个世界的平均情况绝不是每个人都能随随便便一辈子改变世界好几回。认可客观的效率,平静的、踏实的,做好每一件重要的小事,一年回头,也会发现了不起的改变。

人生哲理就到这里,下面来讲讲有趣的话题吧,怎么在现代软件的辅助下轻松的拍星。

现在可选的拍摄软件非常多,老牌的MDL、无痛入门的ASIAir、后起之秀NINA,为什么选了KStars+Ekos呢?主要是开源,以及支持Linux。开源意味着不会被一些和自己设备以及使用方式不符的功能卡死,至少保留了掳起袖子把他改掉的可能性。需要支持Linux是因为我日常的开发机早已是Ubuntu好多年了。功能怎么样呢,其实爱好的力量是巨大的,开源软件是大神们做个产品取悦自己的方式,自己就是用户,才能写出好的产品。具体来说,KStars+Ekos有两个非常牛的功能,直接让拍星从石器时代进入工业文明:

  1. 自动解析

  随便把望远镜指向天空拍摄一张照片,KStars就能根据恒星的相对位置关系解析出当前指向的赤经赤纬,并在星图上显示出来,再手动调整2、3次就能对准想要的目标,想想去年用微单屏幕找目标的经历,浪费时间不说,有时候真找不到目标。

  1. 自动漂移法对极轴

  朝南的阳台无法通过北极星对极轴,只能用漂移法,但手动操作耗时很长。在KStars的辅助下,只需要三步:任意位置拍一张、赤经转动30度以上拍一张执行两次,就能直接显示出极轴偏移量,在屏幕指引下就能直接定量调整水平旋转和府仰,直接把半小时的操作时间压缩到5分钟。

KStars

搬家后拍了很多有意思的目标,主要的设备信息如下,让我们沉浸在星空里,感受这些来自于静谧远方的光吧

  • 主镜:Sky Rover(天虎) 60ED
  • 赤道仪:艾顿大星野SkyGuiderPro
  • 相机:ASI533MC Pro
  • 滤镜:滤镜抽屉+宇隆L-eXtreme双窄带滤镜
  • 对焦:鱼骨板
  • 控制软件:KStars+Ekos+INDI
  • 控制器:树梅派
  • 处理软件:ASIDeepStack,平场:60,偏置场:10,暗场:无
  • 导星:无

NGC 246 小精灵星云,是位于鲸鱼座的一个行星状星云。单张RGB 30s若干,共计0.7小时曝光

NGC 7293 螺旋星云,是一个位于宝瓶座的行星状星云。HaOIII双通道滤镜,单张30s~120s若干,共计3.6小时曝光

NGC 253 银币星系,是位于玉夫座的一个螺旋星系。单张RGB 60s~120s若干,共计3小时曝光

NGC 2237 玫瑰星云,是一个位于麒麟座的电离氢区,距离地球大约5000光年。单张HaOIII 60s,共计7.2小时曝光

M16 鹰星云,是一个位于巨蛇座的电离氢区,距离地球大约7000光年。单张HaOIII 30s,共计0.9小时曝光

马头星云,是一个位于猎户座IC 434内的暗星云,距离地球大约1500光年。单张Ha 60s,共计7.8小时曝光

M42 猎户座大星云,是一个位于猎户座的弥漫星云,距离地球大约1344光年。单张RGB 30s~60s若干,共计3.7小时曝光