我跟你说的一样,只能做静態分析,找到了bug,但不能告诉你这个bug在真实业务场景里会造成什么影响,程式设计师需要的不是“你这行代码有问题”,而是“这行代码上线后会炸成什么样”。”
“所以核心痛点是——”
“是“代码和现实之间的鸿沟”。”苏念念用手指敲了敲桌面,“你上次的原话,我回去想了好几天,越想越觉得你说到点子上了。”
剁椒鱼头端上来了,热气腾腾的。韩路一拿起公筷,挑了几块鱼腮边最嫩的肉放到苏念念碗里。
“先吃,凉了腥。”
苏念念低头看了一眼碗里的鱼肉,全是最好的部位。
她没说谢谢,拿起筷子吃了一口。
“我想做一款工具。”他说,“名字我都想好了,bugkiller。”
“bugkiller?”苏念念念了一遍,嚼著鱼肉,皱了下眉,“名字太geek了,程式设计师听著过癮,但以后要做商业化的话不好卖,先当內部代號用吧,回头再想个正式的。”
“它不只是找bug,它要做的是——”韩路一在脑子里组织了一下语言,“建立一个bug模式资料库,把各种类型bug的特徵、触发条件、影响范围、最优修復路径全部结构化,然后用这些数据训练ai模型,让ai学会“看到一段代码就知道它上线后可能会出什么问题”。”
苏念念放下筷子,身体前倾。
“等等,你说的bug模式资料库,数据从哪来?这是最关键的问题。市面上的竞品之所以做不好,就是因为训练数据只有代码本身,缺乏“代码在真实场景中的表现”这一层。”
“从我这里来。”
苏念念眨了两下眼睛。
韩路一解释:“我这些年写了几十万行代码,debug过的系统也少说有几十个,最近自由接单又修了上百个项目,每一个bug的特徵、触发条件、修復路径,我都在记录。”
这是实话,只不过他省略了视界的部分。
“你的个人经验当然有价值,但一个人的样本量不够啊,”苏念念皱眉,“ai训练需要大量数据。”
“对,所以第一步是做最小可用產品,用我现有的模式资料库做一个原型,先验证思路能不能跑通。如果跑通了,第二步再想办法扩大数据源,比如接入开源社区的bug报告、公开的代码漏洞库、技术论坛的问答数据。”
“mvp先行,数据飞轮后做。”苏

