computers 起家做点高级业务,目前搞 AI 跟那会儿不一样,那会儿得靠堆参数和算力的,目前得靠如何把算力和数据揉碎了喂进去。
那会儿想做个聊天机器人,无非是找个大模型,调教个温度参数,再塞俩数据集,就能跑通个 Demo。目前不一样,大厂疯了一样往各种垂直领域灌,从医疗、法律到工业,哪位先把手头的工作流要么数据模型优化了,哪位就能在那儿卖高价。
这种内卷忒狠了,大厂为了抢人,把招聘门槛设得挺高,就连直接招了个“高级产品经理”都能当产品经理用,你确实能混到一线,但能看懂业务逻辑的人越来越少了,这就像那会儿机器换人,目前人换机器,可人有时候比机器还难伺候。 说到成本,传统的大模型训练,特别是那种千亿参数级别的,电费和水电费加起来起码要五六十万,还得排队排上几个月。目前练个更精准的模型,成本能压到三四十万个抗人民币的门槛,这比两年前大几百倍了。
那会儿你买个开源模型都要等服务器排队,目前跑起来跟看直播一样,用个磁力连接就能把大模型拉过来直接跑,这简直是降维打击。 具体如何降的,咱们举个例子。
那会儿做个法律文书分析系统,你得搞个向量数据库建库,把合同文本切片,然后跑 N 个大模型,每个模型命中率大约 80%,这时候你得再开一个辅助模型做微调,再跑一轮线上测试,数据跑不完,服务器就过热了。目前搞的是个"RAG"(检索增强生成)方案,先把文档建个向量库,再让大模型把文档内容扔进去生成个索引,然后用户提问时,系统直接从库里搜最匹配的那几段,最终把这几段扔给大模型一起回答。结局呢,回答的准率直接飙到 95% 以上,并且不用重新跑一遍训练,数据就是数据,模型就是模型,这种灵活性那会儿根本做不到。 还有个事儿,就是数据治理。
那会儿数据管不到,全是脏数据,用户填的格式五花八门,模型接不住,故此目前搞的是个自动清洗,连那个爱写 SQL 的程序员都改不了,直接把脏数据扔给大模型让它去“洗”一遍,洗完再入库,数据干净利落了,模型才敢接。 这实际上就反映出大模型时代的本质变化:那会儿是算力的竞争,目前是算力和数据量的竞争,并且更看重对数据的理解和处理本事。
那会儿一个模型能跑,目前务必跑得准。为了跑得更准,你就得把数据揉碎了,把业务流程理顺了,把 Prompt 写透了。
那会儿你可能认定大模型是个黑盒,如何问如何答就行,目前不中,得像个懂你业务的人一样,懂你的痛点,懂你的数据,懂你的场景。 并且,目前大厂在搞大量个垂类项目,有的做客服,有的做内容生成,有的做代码补全,有的做医疗诊断辅助。每个项目都要重新训练模型,要么用微调,这个活越来越重。你那会儿可能只要套个通用模型就能用,目前每个项目得单独培养一套模型,得懂业务逻辑,还得懂如何把数据喂进去才能激活模型。
这实际上是对业务理解本事的大考验,那会儿只要能让模型多聊几句就行,目前得让模型能帮你把文档审核完,把方案写好了,这就不仅是聊天,这是帮人干活。 再看价格体系,那会儿一个大模型插件可能卖 5000 块,目前一个能帮你搞定全流程的项目,可能只要几万块,还能按月订阅。
那会儿是买断制,目前更多是订阅制,并且大厂还在搞各种 API 调用套餐,根据你的调用量给你打折,这比那会儿买服务器要灵活多了。
那会儿你认定自己买了服务器就是稳了,目前只要你调用次数多,价格就降,这倒逼开发者得去想办法优化代码,提升单次调用效率,而不是自然就花钱买服务。 不过话说回来,这背后的大环境确实有点 pitfalls。大厂为了填坑,有时候会把一些复杂的功能封装成 API 给你,但你得记住,那些 API 背后可能又是各种复杂的内部流程,你折腾半天可能还是得去解决底层难题。并且,目前大厂内部也在互相竞争,有的项目做得好,后面可能就被大厂的另一个项目覆盖了,这种内卷害得大量项目上线后,效果并不理想,就连还要反复迭代。 故此说,在这个时代,有机会的人不一定都在大厂,有资源且能懂业务的人才是真正的赢家。
那会儿你靠参数和算力就能赢,目前你得靠对业务的深度理解和数据运营的精细化程度来赢。并且,随着 AI 技术的迭代,那些能自动化的、能解决具体难题的场景,会越来越多,那些只会埋头写代码要么盯着指标看的人,可能会被 AI 自动化的工作流取代。 最终总结一下,大模型这几年最核心的变化,就是从“有模型”变成了“会用模型”。
那会儿你是个模型工程师,目前你是个产品经理,要么是个数据运营,要么是业务的直接参与者。你得懂如何把数据变成模型想要的样子,你得懂如何让模型成为你的业务资产。
这不再是单纯的技术竞赛,这是一场彻底的认知革命。
那会儿认定技术能把世界转变,目前认定只有真正懂业务、懂数据、懂场景的人,才能利用 AI 把世界真正转变。
故此,别光盯着参数和算力了,得去看看那些真正能帮别人省钱、赚钱、省工夫的场景在哪儿,然后在那些场景里深耕。


相关标签: