E135|大模型带火的下一个风口:向量数据库

Описание к видео E135|大模型带火的下一个风口:向量数据库

过去十年,产生了类似于Snowflake这样的基于云原生业务的SaaS巨头;在AI时代,向量数据库领域会不会诞生AI时代的“Snowflake”,一个新的历史性机会正在产生。




这期节目我们邀请到了亚马逊云科技与向量数据库Zilliz来聊一聊AI Native的企业级应用。Zilliz成立于2017年,主要研发AI场景的向量数据库,在2019年开源了全球首个向量数据库产品Milvus,并且把这个产品捐赠给Linux基金会,在GitHub上获得了2.5万颗星,拥有超过5000家企业客户,目前累计融资超过1.13亿美元。




本期节目是亚马逊云科技赞助播出的出海特辑的第三期,我们会联合出海企业的案例,探讨不同行业的出海策略与方法论。在这段访谈里,我们将分析大模型时代,为什么向量数据库尤其重要,到底什么是AI时代AI native的数据基础设施。作为出海特辑的案例之一,Zilliz也会分享他们出海遇到的挑战,以及开源社区与商业化的平衡。




【主播】

泓君,《硅谷101》创始人,播客主理人

【嘉宾】

栾小凡,Zilliz技术合伙人,Linux Foundation AI & Data 基金会技术咨询委员成员

吴万涛,亚马逊云科技解决方案架构师




【你将听到】

02:19 向量数据库与传统数据库的区别:基于关键词去匹配vs上下文与语义相似度的匹配

05:53 大模型时代,向量数据库为什么这么重要?

07:47 非结构化数据占人类数据80%,从巨头没有盯上的领域启动

10:26 向量数据库的挑战与护城河:好的模型与算法、性能与推理成本

12:34应用场景:电商提高长尾搜索; 企业私有数据提升精度

16:41 衡量向量准确度:99%的召回率

19:00 OpenAI并不是最好的Embeding模型,开发者需要自己去试

20:34 Zilliz的商业模式:从开源到基于云的商业化

23:28 当巨头跟创业公司竞争:把选择权交给用户

27:00 行业过于早期,云巨头入场正在帮助行业成长

28:57 未来应用:适合电商、医疗、法律等数据密集型应用

29:50 AI时代的安全隐私:合规、产品、应用三个层面

33:26 安全问题打脸:向量数据经过精心设计后,可能会还原用户信息

37:38 移位更加保护隐私,但却让准确性更难




出海挑战

37:35 Zilliz全球业务分布:美国营收占整体收入70%以上

38:47 SaaS产业布局的全球化考量:受美国头部用户影响大

40:16 中美SAAS产品的使用态度区别

45:00 美国市场策略:HackerNews与亚马逊云科技Marketplace




开源社区

49:16 公司主导的开源项目,开源协议有可能被修改

51:17 公司主导与基金会主导,开源项目两种方式的思考

54:38 开源与商业化的代码考量:三层结构的差异化竞争

57:25 当公司发展方向与社区发生分歧,如何解决?




【相关单集】

E133|开源打法的秘诀与AI重塑的数据库行业 (https://sv101.fireside.fm/138)

E130|聊聊智能硬件出海的全球版图:大模型、 新爆款与合规陷阱 (https://sv101.fireside.fm/135)




【后期】

加菲

【BGM】

Cold and Blue - Roy Edwin Williams

Lazy Art - Martin Landstrom

Norman - Boone River




【在这里找到我们】

公众号:硅谷101

收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客

海外用户:Apple Podcast|Spotify|TuneIn|Google Podcast|Amazon Music

联系我们:[email protected] (mailto:[email protected])

Комментарии

Информация по комментариям в разработке