豆语星辰CEO阎鹏:极简商业模式思考

2023-08-14 19:41:53     哔哩哔哩

2023年7月23日,超声波俱乐部AI Open Day在北京举办,百位AI领域顶级创业者、知名投资人汇聚一堂。超声波俱乐部成员、豆语星辰CEO阎鹏进行了一场精彩的分享,以下为阎鹏的分享整理:

分享嘉宾:阎鹏,豆语星辰CEO

分享主题:极简商业模式思考


【资料图】

今天我主要是想讲创业的问题,AI的部分讲得少一点,这些都是我过去5个月的真实感受。大概2月份左右的时候,我们发现大模型出来了一个本质化的版本,当时我的第一感觉就是,我好像突然不会做生意了,因为这个大模型很神奇。

我们公司内部讨论的时候有一种疑问,它是不是一个新的数码的神?我们是不是得拜一拜,prompt就跟拜神的话术一样,然后它就能产生我们想要的所有东西了?

后来我们觉得不太可能,因为我们毕竟搞了十几年的技术,知道所有的技术演进都是有线性规律的,不太可能一瞬间出现一个全知全能的神,所以我们当时用了很长时间去探索这个东西背后到底是什么。

所以我今天先跟大家祛魅,大模型到底是什么,大家不用那么的焦虑、兴奋或者迷茫。大模型本身的技术不是今年出现的,甚至不是这两年出现的。核心两个技术,一个技术是字符向量化,只有把所有的字符向量,包括像素,所有这些我们空间表达的东西,包括文字表达的东西,原来是结构化的东西,向量化之后才可以进行运算,这个东西已经出来30多年了。

字符向量化指导了我们过去所有NLP(神经语言程序学)理论研究,包括我们现在看到的图像化的东西,都是来自于字符向量化这个技术,只是大模型把字符向量化里面的向量集变得非常非常大,这是它的第一个区别。

第二个技术是Attention机制,就是注意力机制。我们知道大模型现在有几十亿、上百亿参数的,参数级特别大之后,实施运算的成本特别高,也很难迅速地、指向性地给出一个答案来。所以你可以这么理解注意力机制,它给了一个窗口,一个搜索和简化向量集分析的窗口,在这个窗口下给出一些东西来,所以说有了Attention之后,它的效率达到了一种平衡。

当我们知道它核心就是这两个技术之后,我们就淡然了,不难受了,也不焦虑了,因为这两个技术出来很多年了,Attention机制出来也小十年时间了,我们大量的双向LSTM(长短期记忆网络)包括现在图像处理一些技术都是用Attention做出来的,所以这个东西不是突然出现的。

接着,我们就分析它到底有什么优势跟劣势,到底怎么用好它。进一步分析之后发现,它有一个独有的能力是过去的AI不存在的,那就是实时生成的能力,因为它有大量数据集的参数,能够迅速地生成一段话。

我们用GPT的时候,会发现它的回答是生成出来的,不是搜索出来的,里面的文本不是先存起来放在数据库里的,而是随着我们的问题和我们上下文一直在改的,这是大家能看到的很大区别点,这也是它的独有能力。

但由于刚才我们说的技术限制,这个能力有几个优点和缺点。优点是什么呢?它有非常强的多样性,因为它是生成式的网络,所以它有非常强的变异性、多样性或者复杂性,因为它里面的数据集跟参数有可能来自于这儿,有可能来自于那儿,有可能上下文的结构里面,你点到了某一个点,它作为一个条件,它就产生了下一个结果;你没有说这一个条件,它就没有下一个结果。它有非常强的多样性能力,多样性是这个模型非常亮眼的地方。

同时,这也是双刃剑,这意味着它一定是不准确的,因为它是实时生成的,它只为实时生成这个结果负责,并没有任何一个校验过程。

我们可以做一个小游戏,比如现在问任何一个大模型,不管是国内还是国外的,我说:“我今天要给我表哥寄一个礼物,是一个大熊猫,请问我是走海运好、陆运好还是空运好?”

大模型会怎么告诉我们?不管它告诉我们什么都是错的,因为它会分析物流、运费,分析所有这些东西,甚至知道大熊猫是个活物,是个动物,怎么托运,但是它不知道不能送大熊猫,是非法的。这里面有一个Know-How或者有一个行业信息在里面,大熊猫是国家一级保护动物,这个东西知识图谱是不知道的,它的Attention窗口里面不太可能搜索到这个信息。

大熊猫是保护动物这个事可能还稍微简单一点,那我问另外一个问题:“我们家孩子是个熊孩子,特别讨厌,最近不想要他了,请问怎么给我弟弟,让我弟弟去养?”

它看到了这个文本,发现熊孩子、教育问题等等这些,它可能给你分析一大堆跟熊孩子教育相关的东西,但是它没有发现也不知道人是不能被轻易地转移抚养关系的,这也是非法的,所以有大量的信息在里面,大模型是给不了这个答案的,这两个例子都是违法不违法的问题。

我们问另外一个问题,英国的货币是什么?很简单的一个问题,大模型一定会给出准确答案吗?不一定,因为所有的知识,即使是这么简单的知识,它也是有时效性的,英国之前是英镑,后来加入了欧盟变成了欧元,后来脱欧后又叫回了英镑,它会告诉你什么时候它的货币是什么,因为什么事情,可能它是合理的。即使是不跟法律有关的这些Know-How,它有很多相关性的历史事件和重要事件发生来牵连这个答案。

前两天我在某团队里问了一个特别简单的问题,我说即使我们做了非常简单的知识性大模型,比如说珠穆朗玛峰的高度有多高,很多人都是80后,我们从小背过这个高度,8848米,大家脱口而出。我说可能是错的,大家一查果然不对,那天查的结果好像是8844点几米。

原因有两个,一个是随着全球变暖,珠峰在融化。第二个是由于全球的气侯变化和变暖等趋势,海平面在上升,海平线的基数也在调,20年之后米数就变了,所以这也是一个很奇怪的问题,简单的知识存储也是会出问题的,所以这也是大模型现在解决不了的,它只能理解语法结构、知识推理,但它无法给出更准确的知识信息。

刚才我说的是时效性,还有一个点是中文大模型可能比英文还要复杂、还要讨厌的一个问题,因为我们过去十几年做了很多中国传统文化和文史文化的一些相关内容,突然发现这里面的难点。

举个例子,有一首杜牧写的诗,里面有一句是这么说的:“东风不与周郎便,铜雀春深锁二乔”,这里面的“周郎”是周瑜,我们都知道周瑜很厉害,很有名,有很多故事,但是当我们问大模型周瑜是怎么死的时候,大模型能给出我们一个中文的准确答案吗?抱歉很难,为什么?因为周瑜这个名字在中文互联网里面有不只两个以上的明确定义,一个是由三国历史、三国志等著作记录下来的周瑜,历史上的周瑜,这是真实发生的,当然也有一些历史史记上的演绎,那是一个版本。

还有一个版本更出名,是《三国演义》这部小说里面写的周瑜,这是一个虚构人物,跟历史版本的周瑜甚至跟其它版本的周瑜区别非常大,因为《三国演义》的作者是有倾向的,他本身是为了捧蜀国汉室这个价值观,为了衬托诸葛亮这个人物传奇,把周瑜这个人物写得稍微贬低了一点,歪曲了一点。

但是由于《三国演义》这个著作又非常的有名,中文有大量的物料、语料是跟它相关的,即使我们看到所谓的国内做中文大模型做得很好的,也是会有很多被《三国演义》的物料污染过的,所以大家其实很难拿它做中文的教育,出来的结果往往是不对的。

其实周瑜活得很好,为什么历史上这些所谓的诗人甚至作家特别讨厌周瑜?我八卦一下,因为周瑜这人活得太好了,长得又帅,又有才华,爸爸爷爷这辈都是东吴里面的大将军、丞相这样级别的官员,他受到老板的信任,自己又文武双全,媳妇还漂亮。

所以所有的文人都羡慕嫉妒恨,因此当有小说表示,周瑜其实是一个小心眼的人,是个什么什么人的时候,大家会说好,太棒了,他果然是不行的。

所以说我们可以看到历史的文化流变过程中有多个版本,不仅有时效性的问题,还有版本的问题,定义域的问题,这些诸多的问题会导致大模型没有大家想象中那么神,它其实是一个简单的技术工具。我今天先给大家祛魅一下,大家不要那么慌,它也没有那么的跨时代,它只是一个技术工具而已。

不管是我们的教育也好、诸多行业也好,我们的知识领域也好,有大量等待我们去解决的问题至今没有被解决好,大量知识的更新问题、时效性问题、版本迭代问题、版本归属问题、定义域问题等等至今没有被解决好,即使是现在国内最强的技术公司,他们做的所有的这些跟知识文本相关的东西,也不过是过去10年我们写的各种专利,像PageRank等等,还没有在知识领域、在信息领域上真正挖到它根部的难题。

所以我今天分享的第一件事情就是,不要认为今天的大模型非常牛逼,特别恐怖,没有那么恐怖。业务中确实有很多问题等待我们去解决,还没有解决好。目前的大模型跟我们理想中能解决很多问题的大模型,差距还非常大。我们研究了几个月之后,突然发现好像还好,没有那么慌了,所以今天先跟大家分析这个事情。

第二个事情,说实话也是我自己身上犯的一个错误。

我们是技术人,搞了十几年的技术,搞了大量的业务创新,遇到了一个技术红利或者机会的时候,就一脑门扎进去了。但前些天我去复盘这个事的时候,突然想到一个问题:我们是在创业,而不是搞技术调研,那我们应该先找客户再做产品,还是先做产品再找客户?

我花了几个月时间,做了一款产品,用上了很多新的技术能力,也做了很多的业务创新,但是突然发现自己陷入了一个创业者的错误里,就是闭门造车。在做出一款产品之后,满世界去寻找谁能欣赏一下我的产品,这是很可怕的。

所以子超让我分享经验的时候,我说没有什么经验,全是教训,因为我们搞了十几年创业,做了很多企业,还是会犯这样的错误,所以我说在座的各位如果没有经验的话,也会犯这样的错误。

其实做2C产品也好,还是2B产品也好,本质上都是做业务、做生意。应该尊重这个规律,先要寻找客户。客户有什么样的需求,怎么表达的,他的认知在哪里。我们要先跟大家打成一片,让有一部分能容忍我们的人陪我们、去迭代我们的产品,这才是正确的一个路子,所以说第二个事情就是分享一下我们最近的一个教训。

第三个事情,如果大家意识到先找客户的话,那接下来的问题就来了,也是创业老炮们经常犯的错误:客户在哪里,还是去哪里推广客户、推广产品。听起来很像,但不是一个东西。

到2022年年底为止,短视频行业获取了大量的用户时间。其实用户的使用习惯跟场景已经发生迁移了,有大量的用户在短视频里面、在直播里面。按照我们的创业经验,我们找用户不会去泛娱乐的大卖场或者是大秀场里面,我们大概率搞个公众号,去市场上面推广一下,搞裂变等等都是这么想的。

其实又会陷入到另外一个矛盾里,是尊重用户在哪里我们去哪里,还是我们做了一个类似的产品或相关的产品之后去推广用户。

后来我们就看了一个案例,这个案例蛮有意思的,这是一个小的数字形象,这个数字形象的号大概启动了三四个月的时间,已经上千万用户了,虽然不是付费用户,只是粉丝,但是它的起量速度快是很多人类主播都达不到的。

我们又研究了一下它背后到底怎么搞起来的,其实是一个动补系统,没有我们想象中那么牛逼,以为是一个自适应AI,能理解语音,其实根本没有,它其实只是包了一个壳,就做成了这个样子,然后有大量的用户去咨询有没有类似的APP,有没有类似玩法的东西,甚至有没有2B的合作机会来做这个事情。

然后我们就发现之前的很多经验对我们来说都是枷锁,我们不应该按传统的2C去找APP推广路径,应该尊重用户在哪里这件事情,现在用户绝大多数时间都在抖音、视频号等这些短视频平台上。用户已经被迁移过去了,这些大公司花了几年时间,用了很大的成本把用户迁移过去了。

而我们找用户不应该去自己找,我们应该把自己的产品力,我们自己的核心主张,我们自己的很多应用能力转化成能在这些平台上火起来的东西,这是我们最近另外一个思考,抛弃掉了很多肉身。我们的创业伙伴跟我们也很多年了,上来就说:“阎总,三个月之内必须给你搞套APP出来。”我当时蛮开心的,现在想想好可怕,APP搞完怎么办,APP搞完之后和用户还是隔得非常远,用户根本不知道我们在干什么。

传统的产品推广路径ROI已经非常低了,目前没有公众号的红利了,也没有应用市场的红利了,早就没有了,我们现在习惯的推广路径其实都不太好用了。以上是我的第三个思考。

这句话还蛮欺负人的,“一个客户不是一个人”,为什么这么说?当我们说寻找客户的时候,很多同学跟我反馈的意见是,阎总,客户都被划分没了,满世界那么多APP,每个手机里装了那么多APP,平均每个人用20多个APP,时间已经占用光了,如果按人计算,早就没有客户了。真的是这样吗?一看这个结论就是反常识的,很多新的优秀的产品都能获取到客户,怎么可能没有客户了呢。

其实这里面有一个本质问题,一个需求就是一个客户,每一个人是由非常多的需求组合起来的复杂体,今天我们在这儿演讲渴了有喝水的需求,一会儿演讲结束之后出去有打车的需求,回到家里面吹空调吃冷饮,需求是非常丰富的,一个人是分时复用的,分场景复用的。

一个人身上有这么多复杂的场景,大家可能都没有意识到。我们在看竞品的时候也要意识到,这些产品对用户来说只是一个过客、一个工具而已,我们不要太担心人们有没有已经被哪些产品获取到了这件事情,其实对我们来说不重要。

这是我们在业务推广时候的教训,我们的推广同学、运营同学在看到巨型公司产品的时候傻掉了,觉得没有推广空间了,获客很难了。其实不是的,本质上是我们的需求没有找准,并没有想好产品模式,需要满足什么东西,只是看表面的用户已经没有了。

刚刚分享了三个教训,这三个教训我们想通了之后,就有一个非常重要的课题摆在我们面前,也是所有创业的同学可能会遇到的问题。那就是,我们的产品模式到底是什么模型?不是刚刚说的LLM,不是大语言模型这种东西,是商业模型,我们到底选择什么样的商业模型?

这个PPT蛮具有欺骗性的,我经常问大家想要什么样的商业模型。常见的免费模型,周总最开始推广的免费,我记得他还写了一本书,非常厉害,免费获客、推广的互联网模式;月租的模型是腾讯视频、爱奇艺等,这些做得非常成功;还有买断模型,买断模型是一次性交付的商品模型。这里面的截图是有年代感的,大家可能看不懂,比如Windows XP Proffesional安装程序里面的输密钥的界面。每个模型都能让业务转起来,那我们用什么样的模型?

我见过很多的分析,很多互联网老炮儿跟我讲:“老阎,我跟你说,这个模型是倒过来的,越往左边,越先进越好,你就用最左边的模型就好了。”真的是这样吗?不好说。

我们做了十几家公司后感觉,其实每一个模型没有什么好坏区分,只是看你擅长解决什么问题。免费模型是转化,因为它的早期推广成本相对低一点,推广后,就会享有非常好的DAU,非常好的用户时长,但有一个非常难受的问题是成本居高不下,但是转化率好不好,有多少人转化成付费用户、忠实用户,这是一个很常见的互联网产品的转化问题。

至于选择月租模型的,不用看他们现在的用户数多高或者新增多少,核心解决的问题是续费问题。先举个例子,最近我们知道爱奇艺跟腾讯一直在PK新的电视剧的上线,为什么?假设一个平台连续一年没有任何爆的电视剧上线,这个平台就没有续费了,所以不要看这么大的公司,这么大的公司命门也是在一个位置上了,非常可怕,这是一个无尽的续费循环。所以大家作为内容也好,作为版权也好,炒IP也好都是为了解决一个问题就是续费问题。

买断模型好像又不用续费,又不用转化,一次性都解决掉了,但是这个模型没有未来,买完之后销售结束了,分完钱之后明年呢?关门吗?要看新增,这个模型的难处是无尽的新增压力,市场空间就这么大,如何获得更多的原来不认识我们的用户。所以不同的模型没有优劣之分,新的胜负手不一样,看我们的团队和产品力,所以每一个模型都有它命门的地方。

我希望大家做AI的时候,或者创业的时候,能先预见到我们选择的模型最难的那个点搞不搞得定。如果搞不定的话,像刚刚子超说的,盲目的看一下DAU和早期数据没什么意义,会死的。

这是今天的最后一页,我们最近的思考和反思是这样的,如果一个大模型不能在业务的胜负手位置产生新的生产力,那么这个大模型最后还是一个效率型的技术应用。就像我最开始说的,大模型是个技术应用,已经很清楚了,它没那么神,主要看大家怎么用。

怎么用还是得看创业的部分,在我们的业务模型里面,到底是哪个是最大的业务问题?这个业务问题能不能被大模型有效地解决掉,如果能,那恭喜你,你抓到了一个风口,可以让你的业务突飞猛进脱胎换骨;如果不能,可能只是一些云厂商的机会,最后卖给我们一些云服务,仅此而已,谢谢大家。

关键词:

相关阅读