上回直播里有人问起nanami的事,今天就把我折腾这东西的经过捋一遍。先试了最笨的办法——打开pycharm新建个空白项目。
环境配置踩坑记
先把python环境折腾官网下了3.11安装包,装完兴冲冲敲pip install nanami,结果命令行跳红字说找不到包。当场懵住,查文档才发现得先装前置依赖。又开终端输pip install numpy pandas,进度条卡在60%不动弹,等得我泡面都吃完了还在转圈圈。
- 换国内源加速:pip config set *-url 镜像地址
- 降级python版本到3.8:卸载重装三回
- 开虚拟环境避冲突:conda create -n nanami_env python=3.8
实战环节翻车现场
import nanami时老说没这模块,气得我重启电脑三次。发现文件居然叫nanami_*,改回马上能跑了。接着测试数据加载功能,csv文件路径明明对着,程序死活报FileNotFound。这才发现系统把文件后缀隐藏了,实际文件名是...
最绝的是处理时间戳转换,代码看着挺对:*_datetime(raw_data['日期'])。运行直接报错,排查半天才发现某行混着"2023年5月"和"May/2023",差点把键盘砸了。
意外收获小技巧
卡在内存溢出时突然急中生智,把8G的csv切成20个小文件,用chunksize=50000分块读取。显示器右下角弹出低电量警告才意识到凌晨三点了,但看着nanami跑出第一个完整结果,兴奋得把凉透的咖啡全灌下去。
今早不死心用linux虚拟机重跑,nohup python * &扔后台执行,切到ubuntu桌面时手滑碰了电源线。战战兢兢重启后,居然在断点处接着跑了!在jupyter里画折线图时,猫跳上键盘踩出满屏彩虹渐变色,意外的比默认图表好看十倍。
还没有评论,来说两句吧...