家人们
作为一个研究者
最怕的就是假装开源的软件
今天我工作了一整天
在给自己的paper做实验
然后因为我们做的是AI+GPS信号降噪相关的研究
所以必不可少的需要运行各大GPS信号降噪API
来进行对比试验
但是谁TMD能想到
十个开源API里面九个都给我灌了屎
活活让我成为
“屎山行者”
(讲鬼故事就要用墓地分割线)
我觉得最过分的就是一个GPS快速降噪模型
我们姑且管它叫A吧
A的paper宣称自己是非常快速的GPS降噪模型
然后他发在了非常好的刊物上,citation也很漂亮
所以我们选择把它加入对比实验
今天我的工作就是让他能够在我的服务器上运行 (因为之前负责这个的队友撂挑子放弃这个模型了)
我花了半天的时间
信心满满的把自己的全自动实验代码
修改到兼容这个API需要的形状
然后在装载这个API的时候意外发生了
他无法compile
为什么?
因为他用的一个包坏掉了
(哦 那就不是作者的问题咯? 理解理解)
然后一看,这个包就是作者写的 (WTF)
为什么无法compile呢?
因为code里面一个非常重要的header不见了
然后我瞟了一眼git的最后commit时间
6年前,正好是他paper发表时间
。。。
所以说他的code从一开始就用不了吗?
然后我再看了一眼citation
300+
给我直接干沉默了
来,大家都来猜猜
这300 多号人是怎么理直气壮的cite一个
根本跑不起来的东西的?
再看一眼paper
他们宣称自己快,但是对比试验只用了自己内部写的方法
然后他们的code本身无法运行
WTF这他妈的是怎么通过同行评审的
HOW?
我在沉默中用git把代码回滚到了昨天的版本
到现在我还处于震惊当中
我甚至开始自我怀疑
难道是我做错了什么步骤?
可是我+三个不同AI都认为是code的问题
如果要是真的不是我的问题
那只能说这paper的靠山牛逼到爆炸了
然后我问了以前负责做这一块实验的队友
队友告诉我
她曾经用了好几天的时间
终于把dependency修复了
但是A需要把辅助的地图数据转换成另一种数据形式
这个转换,慢到绝望,
而且1GB的数据会膨胀到50-100GB
而我的朋友,您猜猜我们的实验需要的一张地图有多大?
整个日本,40多个G
A的数据处理跑了一整天愣是动不了
就算放在小地图上进行测试
A的处理速度也慢到爆炸
要是想要把它做成可以运行的速度
让他快到可以和他们的paper数据媲美
那么地图就会小到离谱
相当于直接给参考答案的地图大小
这种根本就没有实际意义
这种Research能被发出来
我真的觉得他们的靠山超级硬
我甚至现在怀疑
他们是故意破坏code不让compile的
然后开源假装自己很正直的样子
妈的走过最长的路就是虚假开源的套路
比这个更阴险的就是huggingface的API
但是这个我攒到下次再吐槽
|