一周。
韩路一关掉所有接单平台,手机调静音,冰箱塞满速冻水饺和罐装咖啡,一周只做一件事。
前两天最顺。框架和资料库是他的舒適区,闭著眼睛都能搭。第三天开始啃核心引擎,晚上卡住了,模式匹配逻辑怎么调都不对,盯著屏幕两个小时脑子越转越慢。他下楼在小区走了一圈,冷风一吹想通了:特徵提取的粒度选错了。回来改了方案,通了。后面几天顺流直下,接口、串联、测试。视界升级以后他的身体好了很多,换成以前在鼎盛,连续高强度编码三天人就废了,现在不会。
核心中的核心是bug模式资料库。韩路一把用视界积累的几百种bug模式全部结构化,每种bug长什么样、什么条件触发、影响多大、怎么修最优。別人训练ai用的是代码本身,他训练ai用的是代码在真实世界里的精確数据。
训练是最烧钱的环节。
韩路一在云平台上查了一圈价格,算下来光训练这一项就要好几万。他盯著报价页面看了半分钟,ai创业的第一道门槛,劝退九成独立开发者的那道门槛,现在摆在他面前了。
好在他有一个別人没有的优势:数据质量极高。別人需要十万条脏数据才能训练出基本能用的模型,他用视界標註过的三千条乾净数据就能餵出来。数据量小,训练轮次就少,算力也成比例下降。
他选了折中方案:开源轻量模型做底座,竞价实例跑正式训练,做了断点续传防中断,最后花了四万出头。
五年积蓄加上离职补偿,四万不算伤筋动骨。
但四万只是一轮训练。后面要花多少,他不敢细算。
先把原型跑通再说。
第七天晚上,代码写完了。
光標停在最后一行的分號后面。韩路一的手离开键盘,十指交叉搁在脑后,盯著屏幕。
他忽然有点不敢跑测试。
这种感觉他太熟悉了,考试做完不敢翻答案、论文写完不敢查重、代码写完不敢编译、表白完的微信不敢看,越在意的东西越不敢验证。
他站起来,去厨房接了杯水,喝了一口,又倒掉了,走回来坐下。
把bugkiller的原始码丟进了bugkiller,用自己做的刀,切自己做的菜。
运行。
进度条开始走:12%...31%...
他发现自己在屏住呼吸。
47%...68%...89%...

