小火箭配置节点失败
这样,当我们搜索想看的新闻时,结果页会出现它为我们快速总结的资讯要点。大事件的脉络和概要,会通过AI的深度思考总结出来。
比如郑钦文和高芙争决赛门票、中国外贸企业被美国客户疯狂催单这些新闻,我们都能快速掌握言简意赅的内容。
比如在24-25赛季的NBA季后赛中,库里的伤势会对赛局产生哪些影响?是否出战对于球队的胜率有多大影响?
从此,我们在浏览新闻时,就不再是被动接收信息的对象,而是通过多轮次互动的模式,成为主动探索、深入交流的参与者。
依托新浪新闻、微博独有的内容和数据,新浪也打造出了自己的多模态大模型——知微大模型(以下简称知微)。
一方面,它可以对微博广场式的公开历史信息和实时热点数据进行动态解析;另一方面,微博、新浪新闻的权威信源,又为它提供了高可信度的「思考燃料」。
它不光回复幽默,爆梗频出,让人拍案叫绝,还能精妙地get到博主的情绪,发出暖心的安慰。有的回复,更是直戳用户心底。
凭着一条条超绝回复,它已经制霸评论区,成为网友们最为期待的爆梗选手。粉丝量也直冲176w,单日互动高峰甚至能破百万次。
而且,它的功能也是跟着一路升级。从开始的只能简单回复,到现在已经可以跟人聊上好几轮,甚至还能看图说话、听视频聊天。
微博COO、新浪新闻CEO王巍在接受新智元的采访时透露,主要功劳,就在它背后的基础模型——「知微」大模型。
在训练数据上,它使用了微博历史上大量高质量的评论数据,这些数据具有高转发、高评论和高点赞的特点,确保了数据的质量、丰富性和代表性。
在训练方法上,「知微」大模型用了最前沿的强化学习技术,这让它在回复不同领域内容的泛化能力上,都得到了显著提升,从而能够更好地适应各种用户输入,在各个领域都能并生成有趣、个性化的回复。
第一,加了心理学相关的数据,让它更会读懂用户的情绪,发个微博它都能猜出你是不是开心,安慰起来更到位。
第二,借鉴了Deepseek-R1和OpenAI o1那种深度思考模型的技术,训练时加了「思考过程」,回复时能多想几步,逻辑更清楚,内容更有深度。
另一位爆款选手MBTI小行家,上线天粉丝就破了百万,直接让MBTI相关内容搜索量增长了300%。
它基于微博社交数据训练,通过分析用户话题偏好和表情包使用习惯,实时生成性格测试结果,准确率较传统问卷方式大幅提升。
正在追爆款热播剧的你,就可以和它们根据剧情发展而聊天,它们的每一句回复,都仿佛是从剧中「穿越」而来。
在去年新浪新闻举办的「2024探索大会」上,王巍就表示,AI技术已成为推动媒体行业全链路突飞猛进的关键力量。
作为国内头部社交媒体平台,微博凭借其「知微」大模型及原生融合多模态技术的探索,也逐步构建起一个以LLM为核心的智能应用体系。
用户在上面发言也自带语言特色,像那些网络热梗就特别多。另外,微博用户的表达方式也很特别,短小精悍、口语化,还挺有趣。
王巍介绍,在打造「知微」大模型时,微博特别看重三件事:一是数据质量得过硬,二是用上了业内顶尖的强化学习算法,三是尽量让大模型自己推动研发小火箭配置节点失败。
为了保证数据质量,微博采用了双管齐下的办法:一方面用规则筛掉垃圾数据,另一方面还搞了个专门的大模型来给数据打分,自动挑出高质量信息。
谷歌Gemini同样宣称是原生多模态,却注重通用性,旨在打造一个跨领域的「百科全书式」模型。
与之相比,微博「知微」更聚焦垂直场景,依托社交媒体数据独特性,追求定制化体验,而非通用的知识覆盖。
在王巍看来,我们并不需要无数个通用大模型,而是应该在少数基础模型之上,结合行业数据打造的垂直模型。
「知微」在这块下了大功夫,比如针对视频,他们搞了个创新的关键帧抽取技术,因为视频太长没法全塞进模型,就设计了个高效算法,挑出视频里的核心内容,这对提升多模态效果特别重要。
还有在图片和视频内容的表征上,团队基于领先的SigLIP方法,做出了多表征模型集成算法,进一步优化了效果。
有个例子挺有意思,用户发文说:「我以后应该是个很宠小孩的老太太」,文字里没提猫,但配图里有。
评论机器人愣是认出了图片里的猫,回了一句:「这个小猫太萌了,将来也会成为慈祥的老猫奶奶。」这说明它不仅懂文字,还能看懂图片,综合能力很强。
这其中,就有两大核心:一是打造通用的角色大模型,因为角色扮演对能力要求挺特殊;二是针对某个剧综,用多模态RAG把剧情和图片信息加进去,让模型更懂故事,能按角色身份跟用户聊。
数据显示,评论区结合图片理解后,互动率提升了12%,虚拟角色还能通过私信或用角色性格跟用户聊,交互轮次涨了16%。
而在剧综角色大模型私信场景引入语音内容理解和语音内容生成服务后,私信聊天轮次提升超过20%。
在多模态应用的未来探索中,微博还将DeepSeek-R1的深度思考能力引入多模态模型和应用中,以进一步提升模型的智能化水平和应用效果。
它深度挖掘了微博的社交属性,能搞懂新闻事件的来龙去脉,保证资讯和评论的时效性,还能抓住网络语言的独特味道。
在整个大语言模型生态里,「知微」定位就是社交媒体领域的垂直模型,目标是通过挖透社交数据的独特性,给用户带来更贴心的服务和内容。
关于当前爆火的推理模型,在「知微」大模型的部分应用产品中也引入了深度思考过程,这种方法已经被证明是有效的。
它不仅增强了模型生成内容的全面性,还提高了内容的准确性,从而增强用户的互动体验和平台的吸引力。
在用户互动方面,将引入更多场景化、多模态、多轮次的互动方式,通过提供抚慰性互动以赋予用户情绪价值,以及设计更具趣味性的互动以增强社区的活跃氛围。
在内容生产方面,「知微」大模型将成为博主的有力助手和效率工具,不仅提升内容创作的效率,还能保证内容的高质量输出。
对于内容消费,「知微」大模型将通过智能搜索、内容总结和脉络梳理等功能,显著提高用户获取和处理信息的效率,从而优化微博、新浪新闻用户的内容消费体验。