想跟大家聊聊我最近琢磨的一个事儿,就叫它“Paz”。不是啥高深理论,就是我自个儿瞎折腾的一点记录。
起因是啥?
说起来也简单,前阵子偶然间看到个新闻,说一个叫Matteo Paz的年轻人,才18岁,就搞了个什么深度学习算法,叫VARnet,一下子从NASA的数据里头扒拉出来150万个新的天体。好家伙,我当时就惊了!一个高中生,这么牛!
这事儿给我触动挺大的。我寻思着,人家18岁就能搞这么大事,咱虽然年纪大了,但也不能完全躺平不是?就想着,能不能也学学,哪怕摸不到人家那高度,了解了解过程,自己动手试试,也算没白瞎这好奇心。
开始动手折腾
一有想法就想立马试试。我先去网上搜了搜这个Paz小伙子和他那个VARnet。资料嘛英文的居多,专业词汇一大堆,看得我是一个头两个大。什么“深度学习”、“卷积神经网络”、“天文数据处理”,这些词儿单个看好像都认识,凑一块儿我就迷糊了。
但我没放弃! 我琢磨着,直接上手搞那么复杂的算法肯定不现实,那我就从最基础的开始。我主要做了这么几件事:
- 找数据: 我想,既然是NASA的数据,那肯定有公开的?于是我就去NASA官网上翻找,还真找到一些公众可以下载的天文图像数据。虽然不是Paz用的那种海量原始数据,但对我这种初学者来说,也够新鲜了。
- 学工具: 深度学习太复杂,我就想着用点简单的图像处理工具试试看。比如用Python里面的一些库,像Pillow处理图像,OpenCV也摸索了一下,看看能不能对下载的星空图片做点基础分析,比如亮度、对比度调整,或者尝试识别一些明显的亮斑。
- 看教程: 我在网上找了不少关于天文图像处理的入门教程,还有一些介绍机器学习在天文领域应用的科普文章。虽然很多还是看不懂,但多少也能理解一点点皮毛,比如机器是怎么从一堆噪点里“学习”识别天体特征的。
过程中的磕磕绊绊
这过程可没少碰壁。下载的数据格式有时候就很头疼,不是常见的图片格式,得研究半天怎么打开。然后那些图像处理库,看着简单,实际用起来参数一堆,调来调去效果也不明显。好几次我都想,算了,我这纯属瞎耽误工夫。
尤其是那个“识别”,太难了! 人家Paz是用AI自动筛,我这用肉眼加简单工具,对着那些密密麻麻的星点,看得眼睛都花了,也分不清哪个是新发现,哪个是早就记录在案的,哪个又是噪点或者宇宙射线造成的假信号。
的收获(虽然不大)
折腾了差不多小半个月,要说我发现了啥新天体,那肯定是吹牛。我连Paz成果的万分之一都没摸到边儿。但是,我觉得这过程还是挺有意思的。
最起码,我知道了:
- 天文研究现在越来越依赖计算机和大数据了,不再是以前单纯用望远镜看了。
- 深度学习这玩意儿,确实厉害,能从海量信息里头找出规律。
- 自己动手去尝试一个未知领域,哪怕只是学点皮毛,那种探索的乐趣是实打实的。
虽然没搞出啥名堂,但我对天文学、对数据科学有了更直观的认识。也算是从Paz这个年轻人的成就里,给自己找了个学习和实践的动力。以后再看到类似的新闻,我大概能更好地理解背后是咋回事了。这就算是我这回实践“Paz”的一点心得,分享给大家,图一乐。
还没有评论,来说两句吧...