用了shadowrocket不能上网了
成立至今仅18个月,DeepSeek以极低成本实现了与OpenAI相媲美的性能,低调而神秘的梁文锋,推动了这场全球AI技术革命。
从广东农村走出的梁文锋,走出了一条不断升级破局之路。他还是一名量化天才,创立的对冲基金High-Flyer,管理的资产规模曾达百亿美元,跻身中国量化基金前四强。
被称为技术理想主义者的梁文锋,实际上也是理智的现实主义者。他认为,英伟达的领先,不只是一个公司的努力,而是整个西方技术社区和产业共同努力的结果。因为,他们能看到下一代的技术趋势,手里有路线图。中国AI的发展,同样需要这样的生态。
公开信息显示,1985年,梁文锋出生于广东省湛江市吴川市覃巴镇米历岭村,父母是小学老师,从小,他在学业上就展现出天赋。2002年,这名对数学建模充满热情的17岁学子以学校“高考状元”考入浙江大学电子信息工程专业,后攻读信息与通信工程专业研究生。
根据媒体报道,求学期间,梁文锋对金融市场产生了浓厚兴趣。2008年,全球金融危机席卷,他组建团队探索机器学习技术在全自动量化交易中的应用潜力。毕业后,梁文锋就将目光聚焦在表面上波澜不惊实则波涛汹涌的金融市场。
2013年,梁文锋与同学徐进共同创立杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。
招聘启事标题是“幻方科技2016校园招聘——顶尖量化对冲基金公司觅牛人”。正文下面附了一段没有具名的故事——“2008年,L先生带着8万元本金,开始了自己独立的量化交易之路。2015年,经历过7年熊市牛市大轮回的L先生,以每年超过100%的复合收益率迈入了亿元富豪的队伍。这个行业里最先富起来的L先生认为,中国的量化交易将从‘单兵游侠’的时代转向极客汇聚的私募基金时代。他和IT圈的朋友创办了自己的公司,希望能打造一支世界一流的量化私募团队。他们给自己的公司取名‘幻方科技’……‘幻方’取自于中国古代洛书《九宫图》,是一种特殊的矩阵,是科学的结晶与吉祥的象征。L先生的理想是有朝一日能够与世界级的量化交易泰斗——西蒙斯的文艺复兴公司相媲美。”
今年1月20日,DeepSeek的推理模型DeepSeek-R1发布,开源、免费、可验证,在全球科技界引起巨大震动。全球芯片巨头英伟达因此市值一度蒸发6000亿美元。
DeepSeek创立于2023年7月,这是梁文锋正式宣布进军通用人工智能领域,专注于做真正人类级别的人工智能。
梁文锋说,“我们经常说中国AI和美国有一两年差距,但真实的gap(差距、差别)是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。”
谈及AI,梁文锋曾说,幻方某种程度上增强了他对技术驱动型创新的信心,但也不都是坦途。和很多新技术一样,量化投资刚出现的时候也是被嘲笑的对象,没有人相信计算机可以像人类一样进行投资。他也经历了一个漫长的积累过程。外部看到的是幻方2015年后的部分,但其实他已经做了16年。
2016年是幻方科技的重要转折点,当年,公司推出首个基于深度学习交易模型,实现所有量化策略的AI化转型。2018年,幻方科技正式确立了以AI为核心的发展战略。
为解决计算资源不足问题,2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。
有了前期的基础,DeepSeek的研发成果不断涌现。2024年5月,DeepSeek发布了DeepSeek-V2,同年12月27日,DeepSeek-V3面世,今年1月20日DeepSeek-R1发布。这款性能优越且性价比极高的大语言模型,被硅谷同行誉为“来自东方的神秘力量”。
梁文锋说,在这波AI浪潮中,DeepSeek的出发点是走到技术前沿,去推动整个生态发展。他们只负责基础模型和前沿的创新,其他公司在DeepSeek的基础上构建toB、toC的业务。
2024年5月初,DeepSeek宣布,其开源模型DeepSeek-V2的推理成本被降到每百万token仅1元钱,约等于GPT-4 Turbo的七十分之一。随后,智谱、豆包、通义千问、文心一言等国内排名靠前的大模型先后跟进,最高降幅甚至高达97%。
根据公开报道,梁文锋开发的DeepSeek-V3训练成本仅557.6万美元,而OpenAI训练ChatGPT-4o所花费的成本高达7800万美元甚至是1亿美元。OpenAI募集了143亿美元,花了十年时间,而DeepSeek仅仅用了一年多时间。
DeepSeek的员工规模大约150人 ,不及OpenAI的1/5,研发工程师以及深度学习方面的研究人员大约70人,主要在北京分部,其余人在杭州总部,多为前端、产品以及商务人员。
而且,DeepSeek并没有外界猜测高深莫测的奇才。梁文锋曾透露,员工都是一些Top高校的应届毕业生、没毕业的博四、博五实习生。
DeepSeek大模型在“数学、代码和推理任务”方面的表现可与OpenAI的o1模型相媲美,同时仅使用一小部分计算能力。极致低成本,性能与OpenAI媲美,开源、免费,DeekSeek颠覆了全球AI的竞争格局。
DeekSeek的影响持续发酵。英伟达、微软、亚马逊用了shadowrocket不能上网了、华为等全球科技巨头纷纷接入DeekSeek大模型。
最新消息是,2月8日,工信部披露,中国移动、中国电信、中国联通三家基础电信企业均全面接入DeepSeek开源大模型。
据AI产品榜,今年1月20日DeepSeek-R1模型发布后,1月DeepSeek用户增长达1.25亿,实现了7天完成1亿用户增长。而ChatGPT用时2个月。
瘦削、低调,架一副深度眼镜,典型的技术男形象,梁文锋被称为极致的技术理想主义者。DeepSeek坚持开源路线,主动向全球开发者分享核心技术成果。
梁文锋说,在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。“开源更像一个文化行为,而非商业行为。给予其实是一种额外的荣誉。一个公司这么做也会有文化的吸引力。”
梁文锋说,中国产业结构调整,会更依赖硬核技术的创新。当很多人发现过去赚快钱很可能来自时代运气,就会更愿意俯身去做真正的创新。