AI 搜索的一些思考总结:
自从 CHAT GPT 的出现,可以说是颠覆了传统的搜索工具。从以前的 Search engine 演变成一个 Answer engine。从过往输入关键词再给用户推荐链接,到可以直接总结所有内部评分最高的网页, 并分析出一个标准化的答案。
AI 搜索的赛道,如果我们是用一个通用的方向去看,初创的小厂商是很难去跟大厂商去 PK,大厂商拥有的资源,生态建设,多模态搜索等功能都会比小厂商做得更优。加上小厂商又要面对同类型的友商来竞争,所以每家都会寻找自己的特色,把差异化做出来。不管是在介面上、反馈速度、答案精准度、问题判断/分析、多模块分析、跨语言分析等,像 Bing 只接受图片分析、Perplexity 可以上传 PDF 分析内容、Waldo FYI 往 ToB 发展等。
个人判断:以后美国的小厂商会有不少并购机会, 像 Neeva AI 就被 Snowflake 并购了。
在中国通用 AI 搜索行业中暂时没有见到什么初创公司。除了头部的百度和昆仑万维 - 天工 AI,暂时还没有其他竞争者,不过预期腾讯也会往这个方向发展,腾讯在 9 月 7 日公布了最新的混元大模型,相信将来也会把模型嵌入到自家的生态圈中,包括腾讯文档、小程序、聊天机器人、视频、公众号等...
中国的初创公司相信都会往垂直领域来发展,毕竟通用的生存空间太少,垂直领域有更大的发展空间,只要在找到合适的应用场景,将会有很大的价值空间。
01
AI 搜索引擎里最核心的要素
AI 搜索的核心点可以总结为以下几个关键要素:
理解用户意图(Intent Understanding):AI 搜索的核心是理解用户的查询意图,这包括了识别关键词,解析短语,以及理解查询的上下文。为了做到这一点,搜索引擎需要整合自然语言处理(NLP)技术,包括语义分析和上下文识别。
个性化和推荐(Personalization and Recommendations):AI 搜索应当能够根据用户的搜索历史和行为,提供个性化的搜索结果和建议,这需要机器学习模型来分析和预测用户的兴趣和偏好。
多模态搜索(Multimodal Search):现代搜索不仅仅限于文本搜索,还包括图像搜索、语音搜索等多种模态。AI 搜索需要能够处理多种类型的查询,并能够反馈相关的结果。
实时和趋势性搜索(Real-time and Trend Analysis):AI 搜索需要能够追踪实时数据和分析当前的趋势,以提供最新的搜索结果和信息。
内容分类和过滤(Content Classification and Filtering):搜索引擎需要能够自动分类和过滤内容,以确保用户获取的信息是相关的、有价值的,并且不包含垃圾信息。
语义搜索(Semantic Search):AI 搜索应当能够理解查询中的语义关系,而不仅仅是关键词匹配,这可以通过使用语义建模和关系图谱来实现。
反馈和优化(Feedback and Optimization):AI 搜索需要能够收集用户反馈,并利用这些反馈来不断改进搜索算法和模型,持续的优化是确保搜索质量的关键。
隐私和安全性(Scalability and Performance):AI 搜索需要确保用户的隐私和数据安全。这包括了数据加密、用户身份验证和合规性。
可伸缩性和性能(Scalability and Performance):AI 搜索引擎必须具备足够的可伸缩性,以处理大规模的数据和请求,并保持高性能。
多语言支持(Multilingual Support):对于全球用户来说,多语言支持是关键,AI 搜索需要能够处理多种语言和方言才能吸引更多用户。
02
AI 搜索的一些应用场景
AI 搜索在各个领域都有广泛的应用,包括:
互联网搜索引擎:AI 被广泛用于互联网搜索引擎,提供更准确和个性化的搜索结果,以满足用户需求。
可比:例如 Google,百度
电子商务:在线商店使用 AI 搜索来改进产品搜索和推荐系统。这有助于用户更轻松地找到他们感兴趣的商品,从而提高销售量。
可比:Buysmart AI - 电商领域的 AI 搜索,能针对实体产品,提供产品信息分析和用家评价,介面清晰
社交媒体:社交媒体平台使用 AI 搜索来推荐相关朋友、内容和广告,以提高用户参与度和广告投放的效果。
可比:小红书, 抖音, 快手, 知乎
Character.AI
一款可以与虚拟人物聊天的机器人 (slogan 是 AI that feels alive), 2022 年 9 月出 Beta 版, 月活 1 亿用户, 2 个月用户量翻了 4 倍
Cap table - 今年融了 1.5 亿美金,对应 10 亿美金的估值
客户服务:AI 搜索者被用于自动化客户服务,例如通过聊天机器人来回答常见问题,或者通过搜索相关信息以帮助用户。
Comps:营销力量
追一科技-深圳追一科技有限公司是领先者的人工智能公司和 AI 数字员工提供商,公司主攻深度学习和自然语言处理,提供智能语义、语音和视觉性的 AI 全栈服务。追一科技的 AIforce 智能服务系统在金融、零售和生活等行业中提供智能服务和解决方案。
Cap Table
AIforce 具备 AI 语义理解能力,它可以应用于以下方面:
金融行业:AIforce 可以用于智能客服和金融机器人,为用户提供个性化的金融咨询和服务,例如理财规划、信用评估和财务分析。同时,它还可以通过自动化处理、智能风险预警和反欺诈等功能帮助金融机构提高风险管理和运营效率。
零售行业:AIforce 可以与电商平台和线下门店相结合,提供智能客服和智能推荐等功能。它可以根据用户的购买历史、兴趣偏好和行为特征,推荐符合其需求的产品和服务,提升用户体验和购物便利性。此外,AIforce 还可以帮助零售企业进行库存管理和供应链优化,为企业提高运作效率和降低成本。
生活服务行业:AIforce 可以为用户提供生活服务的智能助手,例如在线预约、配送服务和问题解答等。它可以通过自然语言理解和对话处理的能力,与用户进行沟通和互动,提供更便捷和个性化的生活服务体验。此外,AIforce 还可以结合物联网技术,实现智能家居的控制和管理。
医疗保健:在医学领域,AI 搜索用于帮助医生快速获取有关病例和最新医疗信息的数据,以辅助诊断和治疗。
Comps: 大家中医 (给今日头条收购)
大家中医是一款面向中医师和中医爱好者的移动学习社交平台。它的主要目标是为中医人士提供一个一站式的服务平台,为中医爱好者和专业人士提供有价值的工具和平台。主要功能包括中医学习、线上诊所和社交互动等方面。通过该平台,中医师可以注册认证,患者可以通过扫码关注医生工作室,并与医生随时进行线上咨询,提高中医的问诊效率。此外,大家中医还收录了丰富的中医专业知识内容,包括个人医案和经典内容等。用户可以通过不同的方式来学习和了解中医知识。
Cap Table
老夫子 (GBI Health)- 2023 年 2 月被百度收购
GBI Health 于 2002 年在上海成立,是国内首家医疗信息数据提供商,旨在为药企、器械及行业相关服务商提供贯穿全球药械生命周期的全息数据、行业资讯、全球新闻等高价值的洞察,助力企业在战略布局、产品决策、市场洞察等方面引领市场。
GBI 旗下主要产品包括 3 款数据库,即 SOURCE 全球药品数据库、METRIX 研究人员数据库以及 DEVINT 医疗器械数据库。
美国:Apixio
Apixio 是一家医疗保健技术公司,利用人工智能(AI)和先进技术来改善医疗保健运营和结果。该公司提供了一个平台来转换医疗保健数据中的可操作信息,通过协助查找以前被困在非结构化医疗记录系统中的数据,为医疗保健决策提供医疗记录的访问权限。Apixio 的解决方案包括临床指导、利用管理以及风险调整和分析。该公司自 2009 年开始运营,总部位于加利福尼亚州圣马特奥。Apixio 因其风险调整和分析解决方案而被 KLAS Research 评为最佳表现者,并因其在各种 AI 技术方面的专有创新而拥有 24 项专利。客户喜欢与 Apixio 的战略性、注重结果的成功团队合作,该公司在所有客户中的 NPS 得分为 65 分。
公司在 2020 年被 Centene 收购, 再于 2023 年 3 月卖了给 New Mountain capital,估值约 5 亿美金。
Cap Table
金融:金融领地使用 AI 搜索来监测市场动态、分析大数据以及提供个性化的投资建议。
循环智能- 是一家专注于做会话智能与私域大模型解决方案的提供商,2022/2021 连续两年入选 CB Insights 全球 AI 创新百强。2023 發佈了自己的千循大模型平台,在效果和交互场景上,它跟 ChatGPT 基本相似。循环智能帮助在线上线下依靠大量业务人员与客户进行沟通的企业,打开沟通过程的黑盒,实现精细化运营、一线业务人员(销售顾问、销售代表、经纪人、代理人、客户经理等)的效率提升与业务增长。在银行、保险、房地产和汽车等领域,循环智能已经有近 100 家行业客户,包括:中国工商银行、招商银行、中信银行、上海银行、人保财险、太平人寿、泰康人寿、招商信诺人寿、大都会人寿、万科、我爱我家、中原地产、安居客、上汽和中国东方航空等。公司提供的解决方案主要为 SaaS 软件,客单价 30-500 万元不等。
Web 3-KAITO
https://www.kaito.ai
Comps-Kaito 结合了如 Auto-GPT 在内的业界领先的人工智能技术,运用了 GPT4 大语言模型以及 Kaito 的专有实时加密货币搜索引擎,目标为整个加密货币社区提供全新的搜索体验。
Pricing Model
Cap Table
其他行业
教育:AI 搜索可改善教育资源供给端,全面提升教学生产效率。
制造业:在制造业中,AI 搜索用于监控和优化生产过程,检测设备故障并进行预测性维护。
法律:律师事务所可使用 AI 搜索来研究法律案例、法规和先例,有效节省时间与成本。
科学研究:科学家可以使用 AI 搜索来查找与其研究领域相关的最新文献和数据,以支持其研究工作。
交通和城市规划:城市规划师和交通管理者可以使用 AI 搜索来分析交通数据,以改进交通流动性和规划城市发展。
媒体和娱乐:媒体公司使用 AI 搜索来推荐新闻、文章、音乐、电影和其他娱乐内容,以提高用户体验。
当涉及到 AI 搜索和聊天机器人(Chatbot)时,它们确实是两种不同的技术,具有不同的目的、功能和交互方式。以下是关于它们的更详细说明:
AI 搜索:
目的和功能:AI 搜索的主要目的是根据用户的查询提供相关信息或资源。它旨在帮助用户找到他们需要的特定信息,通常与特定主题或关键词有关。
用户交互:AI 搜索通常以一种单向的方式运作。用户提出一个查询,通常是一组关键字或短语,然后搜索引擎分析该查询并返回相关的搜索结果。用户与搜索引擎之间的互通通常是有限的,而不涉及对话。
数据处理和理解:AI 搜索引擎主要处理和理解结构化和非结构化的数据,如文本、图像、音频和视频。它依靠复杂的算法来匹配查询与已有数据中的相关内容。
应用领域:AI搜索广泛应用于信息检索、电子商务、新闻、医疗保健、教育等领域,其中用户需要查找特定信息或资源。
聊天机器人:
目的和功能:聊天机器人的主要目的是模拟人与人之间的自然语言对话。它通常用于与用户进行对话、提供信息、回答问题、执行任务或提供娱乐。
用户交互:聊天机器人支持双向对话,用户可以提出问题、提供信息或发表陈述,而机器人会根据上下文和用户输入来生成自然语言响应,这种交互更接近于人类之间的对话。
数据处理和理解:聊天机器人主要侧重于自然语言处理,包括文本理解、语音识别和自然语言生成。它需要理解和生成自然语言文本,以进行对话。
应用领域:聊天机器人应用于在线客户支持、虚拟助手、自动问答系统、社交媒体互动、游戏中的虚拟角色(NPC)等领域,其中也需要与用户进行对话式交互。
综上所述,AI 搜索和聊天机器人虽然都是基于人工智能技术的应用,但它们的用途、功能和交互方式有显著的区别。搜索引擎旨在提供相关信息,而聊天机器人旨意与用户进行对话和互动。它们可以在不同的场景和应用中独自发挥重要作用,也可以相互结合以提供更全面的用户体验。
AI 搜索使用多种算法和技术来实现不同方面的功能,这些算法和技术可以根据搜索引擎的需求和特定领域进行组合和定制:
TF-IDF(词频-逆文档频率-Term Frequency-Inverse document Frequency):TF-IDF 是一种用于文本检索和信息检索的基本算法,它通过考虑关键词在文档中的频率和在整个文集中的频率来计算文档的相关性。
PageRank:PageRank 算法又称网页排名算法,是一种由搜索引擎根据网页(节点)之间相互的超链接进行计算的技术,用来体现网页(节点)的相关性和重要性,如果一个网页被很多其他网页链接到,说明这个网页比较重要,也就是其 PageRank 值会相对较高
NLP(自然语言处理):NLP 技术包括词汇分析、句法分析、语义分析和情感分析等,用于理解和解释用户的查询以及文档的内容。NLP 技术使搜索引擎能够更好地理解自然语言查询。
机器学习:机器学习在搜索引擎中用于个性化推荐、自动分类、情感分析等任务。例如,协同过滤算法可以用于个性化推荐,而文本分类算法可用于自动分类搜索结果。
神经网络:深度学习技术,包括卷积神经网络(CNN)和循环神经网络(RNN),可以用于图像搜索、语音搜索和语义学分析等领域。
语义搜索:语义搜索,而不仅仅是关键词匹配,来提供更准确的搜索结果。这可能包括使用词嵌入技术(如 Word2Vec 或 BERT)来捕捉语义信息。
实时索引和检索:搜索引擎通常使用高效的实时索引和检索技术,以便在大规模数据集上快速搜索和检索结果。
机器视觉:用于图像和视频搜索的算法,包括图像识别、对象检测和相似性匹配。
声音处理:用于语音搜索和音频内容检索的算法,包括语音识别和语音情感分析。
深度强化学习:在一些情况下,深度强化学习被用于优化搜索引擎的性能,特别是在个性化推荐和广告投放方面。
幻觉(Hallucination)- 模型会模仿人类的口吻说出一些与事实不符合的内容,有时用户很难分辨其真伪。可参考美国一个案例:美国一名律师在准备法庭文件时就让 ChatGPT 来写,结果引用的 6 个判例里,没有一个是真的,在法院纪录里根本找不到这些判例。
(https://edition.cnn.com/2023/05/27/business/chat-gpt-avianca-mata-lawyers/index.html)
解决办法:Retrieval-augmented generation (RAG) 检索增强生成。
RAG 把一个信息检索组件和文本生成模型结合在一起。RAG 可以微调,其内部知识的修改方式很高效,不需要对整个模型进行重新训练。
RAG 会接受输入并检索出一组相关/支撑的文档,并给出文档的来源(例如维基百科)。这些文档作为上下文和输入的原始提示词组合,送给文本生成器得到最终的输出。这样 RAG 更加适应事实会随时间变化的情况。这非常有用,因为 LLM 的参数化知识是静态的。RAG 让模型语言不用重新训练就获取能够最新的信息,基于检索生成产生可靠的输出。
由微软开发的 Microsoft Bing 由人工智能驱动,就算用户提出非常复杂的问题,也可以从 Microsoft Bing 中获得详细的答案,为此,Microsoft Bing 梳理了整个网络的搜索结果,为用户提供了全面的答案。
新版本的 Microsoft Bing 将基于下一代 OpenAI 大型语言模型运行,该模型比 ChatGPT 更强大,使用户能够更快,更轻松地找到他们所需的信息。
Bing 依托于 Microsoft 的生态系统,今年年中推出了 Bing Chat enterprise 和 Microsoft 365 的 Co-pilot,Microsoft 365 Co-pilot 定价为每月一个用户 30 美元,未来也会连接到 Window 的 Co-pilot。
与 OpenAI 的企业版一样,输入搜索的数据不会拿到训练模型,而且可确定公司机密数据不会流出公司,Co-pilot 是跟旗下 Office 产品无缝结合,可以导入 PPT、EXCEL 分析数据并要求得出结论。
Google Bard 现在还是一个测试版,背后用的是 LaMDA (Language Model for Dialogue Applications)是谷歌开发的对话式大型语言模型家族。现支持 40 多种语言,有基本分析能力,但不是所有行业内容都覆盖,例如股票相关资料就没有了。
Komo 是一个由 AI 驱动的搜索引擎,它速度快,保护用户隐私,保证浏览界面无广告。
该搜索引擎提供三个主要功能:聊天、探索和搜索。聊天功能可让用户深入研究自己的想法,与 AI 共同参与主题讨论,探索功能则让用户了解社区中的热门话题。Komo 引擎的搜索功能可以快速有效地响应用户搜索内容,提供相关链接和资源。Komo 搜索引擎的优势在于搜索页面引人入胜,私性密强,效率高。
You.com 是一种基于 GPT 3.5 全新的搜索引擎,可以使用它控制自己的搜索内容、搜索时间和保证数据隐私度。产品包括 YouCode 帮助编码、YouWrite 帮助写作、YouImago 帮助创建 AI 艺术。
You.com 将用户的偏好与人工智能和自然语言处理相结合,让人们控制自己的搜索结果,确保不受大型广告公司的影响。You.com 背后的研究者是 Salesforce 前首席科学家、自然语言处理领地的顶级研究员 Richard Socher,以及领导 Salesforce 自然语言处理团队的 Bryan McCann。该公司得到了风险投资基金 Radical Ventures,基金专注于人工智能的发展,You.com 也得到了 Marc Benioff、Jim Breyer、Day One Ventures 和其他投资者的支持。
定价
帽表
Waldo 名字来源于广受欢迎的“Wheres Waldo”游戏,内容方面结合了 Google 和 Bing 等搜索引擎的搜索索引。Waldo 拥有独特的搜索界面,和其他搜索引擎都不同,Waldo 会将答案变为一个个可扩展的主题,用户只需单击觉得相关的主题即可得到更详细的内容,相比之下 Waldo 更为针对性以及全面。
Waldo 可以节省搜索时间,这一点受到了用户的称赞。Waldo 通过将搜索登录页面转变为用户自定义的界面,或者彻底改变搜索登录页面,使用户能够更好地控制其搜索结果,而无需打开多个选项卡。
此外,Waldo 中还有一个内置的记事本,方便用户记笔记,然后可以将其转换为完整的演示文稿,或导出到 Google Docs。简而言之,Waldo 提高了搜索效率,使用户的搜索过程更顺畅,更便捷。
Waldo FYI 的介面
定价模型
Perplexity AI 是一种尖端搜索引擎工具,它利用复杂的人工智能技术,包括 OpenAI 的 GPT-3 模型。
它与传统搜索引擎有很大不同,传统搜索引擎仅仅提供简单的链接列表,而 Perplexity AI 允许用户轻松访问所需页面,无需筛选不相关的结果或浏览多个页面。在这方面,Perplexity AI 类似于 Google PageRank 算法,这种算法可以用来评估网页的质量和相关性。
Perplexity AI 没有广告,不需要注册或登录。此外,这种搜索方式既安全且私密,不收集任何个人信息。
定价
帽表
Andi 通过利用语言模型的强大功能,更好地了解用户的搜索查询,并实时预测最相关的信息来源。这种方法使 Andi 有别于依赖静态关键字索引的传统搜索引擎。Andi 的搜索方法类似于人类的思维,即使用语言模型辅以推理和常识。
Andi 的用户界面不同于标准搜索引擎布局,令人耳目一新。Andi 拥有“阅读”、“总结”和“解释”三大功能,其文章阅读页面简洁、无广告,可以节省用户时间。
Yep 是奖励和补偿内容创作者的最新搜索引擎,创意来自于 Dmytro Gerasymenko 和他在 Ahrefs 的团队。Ahrefs 以其尖端 SEO 工具集闻名,并拥有一个互联网规模的机器人,该机器人自 2010 年以来就一直在存储,索引整个网络的信息。
是的,搜索结果页面(SERP)使用极简主义。用户可以在网络结构或新闻结果之间进行抉择。此外,在一些搜索页面的右侧有“知识”框,框中展示了从维基百科中提取的有关用户搜索的内容。
Yep 团队会使用 90/10 的收入分成业务模式奖励和补偿内容创作者,其中 90%的广告收入直接流向这些创作者。换句话说,通过使用 Yep,用户可以直接把钱给到他们最喜欢的内容创作者手里。
帽表
Anthropic 是一家由前 OpenAI 团队成员创立的初创公司,最近它推出了一款名为 Claude 的 AI 聊天机器人,将其作为 ChatGPT 的竞争对手。2023 年 7 月公的最新型语言模式 Claude 2,升级后的模型,在编码、数学和推论方面的性能都有所提高。与 ChatGPT 类似,Claude 能够用执行基于文字词对话的任务如文档搜索、摘要、写作、编码,以及响应用户的提问。根据 Anthropic 的说法,Claude 比其他模型(比如 ChatGPT)拥有多项优势,比如对话更理性,有效地减少了令人不安、含暴力成分等有害输出的可能性give the most helpful,but not actively harmful。一方面,Claude 提出了更多对话框友好的对话技巧,更容易引导到特定的对话框方向。Anthropic 声称 Claude 不太容易产生有害的输出,它使用的是以人为本的语言建模方法,并根据语言的深层结构来构建模型,这种建模方法搭配上 Anthropic 对可控性的特别设置,使得 Claude 避免了大部分有害输出。另外,当被问及超出其知识领域的话题时,Claude 会推迟回答,降低产生虚假信息的风险。
自 2020 年底以来,Claude 一直在与发布合作伙伴进行安静的 Beta 测试,包括 AssemblyAI、DuckDuckGo、Notion、Quora - POE 和 Robin AI,具体产品包括为 DuckDuckGo 推出的 DuckAssist 工具、Quora 的 AI 聊天应用程序 Poe 和 AI 写作助手 Notion AI 提供支持。
Cap table - 最新估值为 4.1B 美金
Koala 是 UC Berkeley 发布的基于 LLaMA (meta) 微调的聊天机器人模型。Koala 可以有效地回答各种用户查询,生成的回复通常优于 Alpaca (Stanford 基於 LLaMA 调整的版本,不過在 2023 年 3 月基於成本和安全考量下架),并且在超过一半的情况下与 ChatGPT 相当。
Koala 有两款产品 Koala Chat 和 Koala Writer,Writer 可根据不同文章模式来生成 5000 字以下的文章。
定价模型
更高容量计划
Neeva 由原本带领 Google 广告科技业务的 Sridhar Ramaswamy 与 Sridhar Ramaswamy 于 2019 年共同创办,在生成式 AI 的风潮席卷下,他将 Neeva 定位为可提供时事资料和事实查核的 ChatGPT 竞争者,并于一月时推出搜寻服务 NeevaAI,让使用者用自然语言搜索资讯,由 NeevaAI 提供答案的摘要,和附上答案的资料来源。
Neeva 的核心卖点在于其不透过广告来获利,并且会阻止第三方追踪使用者的个人数据,Neeva 转采用传统的付费订阅方式,但后续仍推出免费方案。Neeva 曾表示,搜寻引擎共累积了超过 60 万名用户,不过其中绝大多数是采用免费方案。
在今年 5 月 Neeva 宣布关闭 AI 搜寻引擎服务,并由 Snowflake 并购,下一步有可能将转向 ToB 发展。
Neeva 对停止搜寻引擎服务的决定进一步解释,在过程中公司发现虽然建立一个 AI 驱动的搜索引擎在技术层面并非难事,说服使用者为更好的搜寻体验付费也并不困难,但最大难处在于让使用者离开熟悉的搜寻引擎,去体验并转换到其他平台。
9 月 5 日,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型(Multimodal Large Language Model,简称“MLLM”)测评中,综合得分排名第一。其他上榜该项国际性多模态大模型测评的包括全球范围内具有多模态能力的大模型。这标志着昆仑万维天工大模型在多模态方面跻身世界领先水平,未来将有力支撑公司旗下 AI业务矩阵取得关键性突破。
多模态大语言模型(MLLM)依赖于 LLM 丰富的知识储备以及强大的推理和泛化能力来解决多模态问题,目前已经涌现出一些令人惊叹的能力,比如看图写作和图文对话。但仅就这些案例很难充分反映 MLLM 的综合性能,目前行业内缺乏对 MLLM 的全面评测。腾讯优图实验室联合厦门大学在新建的评测基准 MME 上首次对全球范围内 MLLM 模型进行了全面定量评测并公布了 16 个排行榜,包含感知、认知两个总榜单以及 14 个子榜单。MME 数据集是一个最近发布的多模态语言模型测评基准。MME 通过评估大型多模态语言模型在涵盖感知和认知任务的 14 个子任务上的表现来全面评估它们。昆仑万维天工大模型多模态团队的 Skywork-MM 模型位列综合榜单第一,其中,感知榜单排名第一、认知榜单排名第二。(榜单地址 https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models/tree/evaluation)
整个介面都跟 Perplexity 的相似度非常高,包括参考链结, 相关问题,历史搜寻记录等。
Chat 版里还有一个文章生成,只要输入你的题目就可以生成一篇文章。里面还提供一些协同办公的工具, 像提供模版供创作用, 给用户去选择自动生成一些不同格式的文章。
旗下有 3 款产品
Pro 是基于 GPT 4 做的开发,接入前需事先获得 GPT 4 的 API,除天工 Pro 之外还有天工 GPTChat Pro,天工 GPT Plugin 和天工 GPT Agent (内测 8 月底才开始)。
天工 GPT纸
我们上传了一份券商的研究报告,试试他的分析能力。
总结:平台能理解报告内容,虽然没有准确的找到答案,但是有针对问题且按著报告的内容提供假设性推断。
Perplexity AI 是一种新的 AI 聊天工具,它基于 OpenAI API 作为强大的搜索和问答引擎。它使用与 ChatGPT(GPT-3)相同的模型,并利用其 AI 语言模型以及从互联网获取的相关信息来提供相应的答案。当用户输入问题时,该模型会搜索互联网以提供答案并显示信息来源。Perplexity AI 的核心产品是 Perplexity Ask,它是一个基于人工智能的搜索引擎平台,利用大型语言模型回答复杂问题。Perplexity Ask 使用 OpenAI 的 GPT-3.5 模型和 Microsoft 的 Bing 搜索进行支持。与传统的搜索引擎提供链接不同,Perplexity Ask 会摘要结果以提供直接答案,并提供引索,使信息得以被验证。
核心的卖点是反馈速度快,答案都有索引,不会出现幻觉(Hallucination)现象。
Perplexity AI 成立于 2022 年 8 月,由 Aravind Srinivas、Denis Yarats 和 Andy Konwinski 共同创立的初创公司。Aravind Srinivas 曾在 OpenAI 负责语言和扩散生成模型的工作,Denis Yarats 曾在 Facebook AI Research 担任 AI 研究科学家,Andy Konwinski 是 DataBricks 的联合创始人。
Perplexity AI 是一个结合了搜寻引擎与聊天机器人 ChatGPT 功能的工具,它可以在 AI 问答时瞬间分析即时网路资讯,节省你大量搜寻与整理的时间。而且,速度是这里的一个关键,Perplexity AI 即时搜寻与整理网路答案的速度比 New Bing 要快上许多,比 ChatGPT 最新推出的网路搜寻外掛更稳定与可靠。所以核心用户都在知识领域使用 Perplexity,目前尚很难成为一款低门槛的大众化使用产品。
Perplexity AI 最近还结合了 GPT-4 Copilot 的功能,在我们提出问题后,AI 具备询问澄清问题、进行深入问答的能力,意思是他会「反问」我们的需求,让我们可以进一步厘清资讯或追问细节,以帮助我们结合搜寻与 AI 来生成真正需要的内容。
现在免费账户就能有限度的体验 Copilot 功能,透过 ChatGPT 的 GPT-4 引擎,在使用问答的时候可以自己动手。
产品优势
- 更具体的了解提问的目的与需求
- 在有需要的时候可主动要求聚焦问题、澄清问题
- 即时搜寻网路找出可整合的资料
- 引用网路资料生成更精准的答案
在提问对话框的左下角,我们可以看到另一个下拉菜单“Focus”。用户可以选择引擎侧重的信息源,默认是搜索整个互联网(All)。也可以选择学术搜索(Academic)、写作(Writing)、计算知识引擎 Wolfram Alpha、YouTube 视频以及 Reddit 社区。
注册用户还可以在“我的对话”(My Threads)里看到自己的所有提问。Perplexity AI 拥有“记忆”能力,就是用户的历史提问,与 AI 的聊天,这些内容都会被自动保存。这是 ChatGPT 和 New Bing 自身目前不具备的能力。而用户每一次打开 ChatGPT 和 New Bing,开启的都是一段全新的对话,以往的聊天记录都不会被保存下来。
优化速度迅速
用户量
超过一半的用户都是 34 岁以下,占总量的 57%,当中包括了还在求学、对体验要求更高的用户群。
定价模型
Perplexity AI 是一家私人持有的公司,Perplexity AI 由 AIX Ventures 支持,后者持有该公司的少数股权。该公司的平台允许客户轻松开发人工智能技能和获取知识,使用 Perplexity 搜索服务来处理其内部数据。
Perplexity AI通过 A 轮融资筹集了 2,560 万美元。由 New Enterprise Associates Peter Sonsini 领投,Databrick 跟投,种子轮投资者包括 Elad Gil(Color Health 创始人)、Nat Friedman(GitHub前首席执行官)、Jeff Dean(Google AI 高级副总裁)和 BobMuglia(微软前总裁)参与投资。此外,新投资者 Susan Wojcicki(Youtube 前首席执行官)、Paul Buchheit(Gmail 的创建者)、Soleio(Messenger、Dropbox 的设计师)和 Databricks Ventures 也参与了融资轮次。投后估值为 1.5 亿美金。
Perplexity 的重心在于打磨产品,而不是自建模型+搜索技术栈。现在底层用的是 OAI 和 Google/Bing 的 API,但这样做的劣势是成本偏高,且定价权掌握在别人手里,其中 Bing 已经将其搜索 API 的价格上调了 10 倍。
收入模式是基于订阅模式,缺乏其他收入渠道,在不依赖广告的情况下,只能针对对内容准确度有要求的用户来收费。在同一赛道里,更像倾向从 OpenAI 那边去抢收费用户。
护城河不够深 - 内容精准度是一个可以用技术解决的问题,像 Microsoft 的 Bing 企业版就有可证实的索引的功能,更可把答案做成可视化的效果(棒形、图表等),公司需要找出多模态样式。
OpenAI 从 2022 年收入 2,800 万美金,到预期 2023 年收入 2 亿美金, 2024 收入 10 亿美金。可见整个 AI 搜索的 TAM(Total Available Market)在持续扩大,主打针对内容更精准的 Perplexity 能不能从 Open AI 抢走一批用户还需要时间观察, 除非他们往更垂直领域发展。
小的 AI 搜索厂商是很难跑出来,主要原因是这个赛道的同质化很强,不靠生态圈是很难做到一个很好的护城河。除了 Anthropic 有以前 Open AI 的团队、Google、meta 等有能力开发新的大模型以外,市面上大部份的 AI 搜索厂商都需依赖 OpenAI 的大模型来建设,变相主导权被大厂商所控制。
市场上AI搜索的两种收费模式,将来遇到的挑战:
广告收入 - 要从更好的用户体验来改变大众的用户习惯 (Yep, Andi)。
订阅 - 大多数还是 ToC 端为主,除了 Waldo 有 ToB (team) 的版本外, 会使用付费版的用户都会对平台的综合分析能力 (NLP), 多模块分析(图片, 文档), 内容生成(AIGC) 等有一定要求,如果只靠 feature 是很容易被复制,很难做到一个很深的护城河。如果要突破而出,必须要做到很精细, 像 Waldo 的这种精细的结构化答案,Perplexity 可追查索引的答案等,you.com 对突完整的生态(一个平台生成图片, 文字, AI 搜索)。
将来判断 :
像这一类的小厂商将来被大型的 IT 公司并购,像是 Salesforce、 Hubspot、Workday、Amazon、Adobe 等对他们自己的产品生态部署有帮助,可以更好融入他们的应用场景,提升更好的用户效率/体验,这些都会带来很多并购的机会。
-