本篇内容来自OpenAI Applied AI 团队的 Shyamal Hitesh Anadkat 的最新博客,Shyamal 目前在@OpenAI 负责不同的应用的市场推广策略,如ChatGPT、Dalle 。
(资料图)
今年以来,已经刷了太多 OpenAI 首席几大护法的访谈与分享,这回不如接接地气,让这位年轻印度小哥 Shyamal 带我们从 OpenAI POV 视角,感受 AI 行业的真正变化与真实洞察,全文内容分 6 节,如下:
前言;
AI 原生 vs AI 赋能;
基础设施、工具和技术;
应用、影响和垂直领域;
创始人的AI-IMPACT框架;
对于初创企业的机会;
原文链接:https://shyamal.me/blog/frontiers-startups-2023+
过去一年变得异常激动人心又有成就感。激动人心是因为 AI 的快速发展,让人感到异常惊奇;而成就感则来自于人们对语言用户界面的热爱以及社区对 AI 与人类共同创作的支持。ChatGPT给很多人带来了一种激动人心的感觉,就像他们第一次玩电脑时那种刺激。我听朋友说过:“他们感觉自己就像第一次来公园玩一样,尝试新鲜事物,一玩完一个就迫不及待地跳到下一个项目。”
到目前为止, AI 带来了更多好处,我们也更加明白了错位的重要性和严重性。2022/3年是人类与人类共同构建未来的重要里程碑。
ChatGPT已经变得不可或缺, AI 以及支持它的相关领域也成为发展社会和系统的关键组成部分。基础模型正在变得多模态、更有能力、更加协调和更加安全——gpt4可能是人类迄今为止最复杂的软件。技术正在突破边界,简化我们对互联网的复杂性以及人类推理和思考的理解。
传统软件曾主宰世界,而 AI ,特别是生成式 AI ,正在主宰软件,推动着创新浪潮,重塑我们与技术互动的方式,重新定义创造力和智能的本质。
AI 不仅是一项具有颠覆性的前沿技术,更是每个人都想要的一种工具,我们必须加以利用、引导和建立防护措施。重要的是要指出, AI 非常令人兴奋,其潜力似乎无限,但我们不能忽视 AI 错位的风险,我们每个人都有责任确保这项技术体现我们共同的价值观和伦理这是一段激动人心的旅程,但安全必须是不可让步的首要任务。
让我们探索一些关键领域取得的进展以及决定初创公司成功的因素。请注意,由于现在仍然是早期阶段,很难预测未来,所以请谨慎对待本文中的任何推测。
AI的最重要的发展之一就是新的交互范式和能力的出现,这导致了许多“AI x ...”类的项目的出现,比如AI x 律师、AI x 导师、AI x 保险核保员、AI x 教练等等。全球各地的许多团队正在追求这些激进的想法,只是时间问题,其中一些项目将变得家喻户晓。
最有用的生成式 AI 应用程序出现在验证一个生成的成果的准确性、质量和完整性所需的时间和精力显著少于最初创建它的时间和精力的领域。
例如,一个会计师可以在短时间内验证一个个人税务申报表,而不是从头开始创建一个。随着时间的推移,这种分配可能会向另一个方向转变(我们将越来越难以验证由 AI 生成的成果,包括新的科学研究)。
随着我们需求层次的发展,旨在简化的技术抽象也在不断进步。AI-enabled(AI增强型)的体验将AI引入人们现有的工作流程和工具中。
与此同时,AI-native(原生AI)的初创公司从AI优先的原则出发,通过自然语言重新定义与每个软件的交互,关注的是工作本身,而无需用户担心与特定工具和用户界面的复杂性。语言是最高级别的抽象,也可能是我们与人类和机器交流的最有效方式,至少在我们找到神经界面之前是这样。
我们希望能有一个友好的助手,能够像我们一样体验世界,帮助我们实现目标,规划我们的一天,自动化知识工作,为企业提供强大支持,帮助人类解决癌症和太空探索等问题,增强我们的优势,并让我们更加幸福。ChatGPT和插件模式是少数几个能够以规模帮助人类进步的颠覆性技术之一,它体现了这一趋势。
这些技术继续推动我们所能取得的成就的边界,成为各种创造性和推理任务的乘数效应。此外,提高我们的学习、沟通和创造能力将对我们的生活和工作产生深远的影响。
应用层正致力于自动化高度重复的任务和/或增强与人类合作的能力,B2B初创公司正努力将AI引入业务工作流程,采用差异化的用户体验、自然语言界面和处理大规模非结构化数据的新方法。
随着这一领域的成熟,我们正在见证像NotionAI这样的AI-enabled产品的采用,这些产品将基础模型集成到现有的工作流程和产品中,以及像Descript这样重新设想视频编辑和内容创作的AI-native平台。基于AI的个人助手简化了消费者的交互层,使他们能够使用自然语言完成目标驱动的任务。
AI的价值不仅在于生成更高质量的内容,还在于能够从大量的信息中提取有意义的信号并减少信息过载。通过从噪音中提取有意义的信号,AI变得不可或缺。
在基础设施和工具层面,我们正在看到一个堆栈的出现——新的基本组件和LLMOps平台降低了进入门槛,并加速了大规模创建LLM应用程序的过程。
Langchain成为这个堆栈中的重要组成部分,它使构建数据感知和代理式LLM应用程序更加容易,并简化了部署过程。Portkey正在构建一个监控、模型管理等方面的LMOps堆栈,而Vellum正在开发一个用于LLM应用程序的开发平台。像AirOps这样的公司正在创建允许企业以结构化、可预测的方式将 AI 应用于工作流程的平台,这些平台可以根据特定的业务环境进行定制。
向量数据库正成为堆栈的关键组成部分,因为嵌入向量为构建具有检索和搜索功能的LLM应用程序提供了动力。Weaviate是一家正在构建开源AI原生向量数据库的公司。我们很可能会看到一系列平台的出现,旨在帮助追踪和评估LLM工作流程,减少幻觉,使模型更易控制,简化数据安全,并提供能够为基于AI的应用程序提供伦理准备和完整性的工具。
LLMOps仍处于初级阶段,大致分为以下几个类别:
提示管理和评估(提示工程、审核、跟踪、A/B测试、提示链接、调试提示、评估等)。这还包括跨多个基础模型提供商进行提示链接;
无代码/低代码微调/嵌入管理(包括用于在特定数据集上重新训练通用模型的工具,标记、清洗等)
代理集成/基于行动的LLM决策,执行行动,目标规划,与外部世界接口等;
分析/可观察性——成本、延迟、速率限制管理、可解释性等。在这个领域的开源项目应该至少要考虑两次产品市场适应性——首先是为了在项目周围创造价值和社区,其次是在将业务与之结合时。创建一个可靠和适应性强的基础设施和工具层将帮助我们为更多用户和应用释放LLM的潜力和价值。
就像半导体芯片经历了商品化过程一样,基础模型(OpenAI、Anthropic等)现在也走上了类似的道路。由于创新的不懈推进,当今的前沿LLM很快就会成为明天的标准,价值焦点从简单的拥有转向了独特的应用、定制和整合。
因此,竞争力不是来自技术的获取,而是来自创新和应用。开源和专有的LLM在这个不断演变的范式中都有各自的角色,企业需要根据其独特的权衡平衡来做出选择,包括安全性、安全性、许可、微调、性能、成本、延迟和能力等方面。
基于开源基础模型可能会落后于几代,主要是由于计算能力、资金、数据和对齐进展等方面的限制,但它们对于一些业务工作流程来说仍然是至关重要的。对更多数据进行训练以训练更小的模型已经显示出一定的成功,某些基准测试中表现优于较大的模型。
此外,使这类模型更易访问的目标也取得了一定的成功,例如Meta的LLaMa和斯坦福大学的Alpaca模型可供研究人员甚至爱好者训练和运行。总体而言,对于利用生成式 AI 模型的构建者来说,重点应该放在领域专业化和构建用户喜爱的产品上,而不是关注底层技术。
为了弥合基础模型与其实际应用之间的鸿沟,边缘计算成为部署这些模型、推动 AI 创新进入新领域的强大平台。
今年早些时候,高通 AI 研究成功地通过全栈AI优化在边缘设备上部署了一个流行的10亿+参数的基础模型(稳定扩散)。边缘 AI 由于其实时数据处理能力、改善隐私和增强安全性的能力而变得至关重要。由于设备普及了大量传感器产生的海量数据,边缘 AI 在各个垂直领域的重要性日益凸显。基础模型的复杂性和资源需求给边缘设备上的部署带来了挑战。
为了应对这一挑战,重点将转向专用硬件、优化技术和神经处理器架构。能够在边缘/设备上运行经过优化的基础模型将开启无限的可能性。为了应对这些新需求,BrainChip提供了创新的解决方案,如Akida处理器,这是一种用于边缘 AI 的先进神经处理系统。了解和评估边缘 AI 技术对于克服部署挑战并探索新潜力至关重要。
技术的融合是真实存在的,我们正处在降低创造力和智能边际成本的边缘,发生了很多变化。在企业堆栈层面上,我们看到了利用生成式 AI 在市场营销、销售、生产力、安全性、客户支持等方面加速增长的趋势。
随着语言模型在推理、事实性和可控性方面的不断提升,我们自然而然地看到它们在法律、医疗保健、教育、建筑、气候和创意领域等多个垂直领域得到采用。让我们从影响最大的领域开始。
1)教育
例如,在教育领域,可汗学院利用GPT-4驱动Khanmigo,这是一个为学生提供虚拟辅导员和教师助手功能的AI助手。
AI 有潜力为地球上每一个学生提供个性化、低成本的辅导,这让我感到非常激动。通过课程重新设计、意识提高和gptzero等工具,我们正在更好地解决关于LLM在课堂上抄袭的担忧,例如,纽约市公立学校最近撤销了对ChatGPT的禁令,因为他们意识到并接受了它在教师和学生中的潜力;它是一个伟大的头脑风暴和创造力的伙伴。
2)医疗
在人机协作的医疗保健领域,将重新定义。例如,Ambience的AutoScribe全面捕捉每个患者的细节,不需要虚拟或现场人工记录员。Glass Health是该领域的另一家初创公司,正在为临床医生构建一个人机协作的决策平台。他们的平台将LLM与由临床医生创建和维护的临床知识数据库相结合,生成DDx和临床计划的输出。这两个平台使医生能够花更多时间与患者交流,并自动化单调的行政工作。
我们还看到了基础层面的机会——Hippocratic AI正在为医疗保健构建一个以安全为重点的LLM,该模型在114项医疗保健考试和认证中超过了GPT-4的105项。心理健康正变得更加民主化和易于获得。
全球心理健康状况下降,以极低成本提供高效个性化的心理健康服务从未如此具有挑战性。Kai.ai正在构建一个AI健康伴侣,帮助您感到更快乐、更平静,并成为最好的自己。
照料他人是另一个领域,AI驱动的解决方案如ChatGPT具有民主化和革命化的潜力。通过将用户连接到支持小组、经济援助和休息护理服务,ChatGPT可以改变照料他人的方式。例如,Milo(Converge公司)正在为父母构建一个共同驾驶员,通过处理日常细节为忙碌的父母节省时间和精力:“通过将人与最新的LLM功能结合起来,我们能够通过简单的对话短信界面有效地构建一个用于详细、高上下文和嘈杂任务的共同驾驶员。”
3)科研
在科学研究方面,进展令人鼓舞。在药物研发领域,我们已经处于生成式 AI 的前沿,帮助加速新药物的开发并降低不良副作用的可能性。例如,E-Therapeutics正在利用LLM进一步自动化寻找新药物靶点的探索,尤其是基因沉默方面。
此外,研究的方式也将发生变化——Ought正在构建一个名为Elicit的AI研究助手,帮助自动化研究工作流程。同时,我们正在建立更好的工具来评估性能良好的基础模型提出的科学论断。强大的评估框架和特定用例的评估是迈向这一目标的一步。
4)客服
客户服务和支持工程将逐渐转向减少人为参与,使企业能够更好地倾听客户需求并以客户为中心。举个例子,Kapa正在为面向开发者的产品构建ChatGPT,通过学习开发者文档、教程、聊天记录和GitHub问题来自动生成回答开发者问题的聊天机器人。
在基于行动的客户服务自动化领域,Ada正在用LLM彻底改变客户体验。“Ada已经在使用GPT-3自动化客户意图的培训,并将通过自动构建答案流程和内容来进一步推动集成。Ada还在尝试使用生成式 AI 来增强提供给机器人构建者和现场代理人的对话洞察力。”Ada的解决引擎连接到业务系统,并采取行动改善解决方案。
随着我们向着“5级”客户服务自动化迈进,我们的成功指标和关注点应更多地围绕解决方案而不是转接。此外,我相信这样的系统将更好地理解复杂的意图、连贯的回应、代表用户采取行动、微调客户数据、自动化工作流程和内容生成,并高效地与人类进行交互。
5)招聘
基础模型使招聘和人力资源运营变得更加简单。Dover正在为其平台开发深度AI个性化和定制招聘解决方案。他们已经构建了一个招聘共同驾驶员的版本,简化了招聘流程。类似的,像CoderPad这样的代码面试平台也集成了AI聊天功能,旨在实现协作,允许候选人和面试官查看和与AI标签进行交互。
6)编程
我们还在重新发明软件工程的方式,重新定义和强化SDLC。五年前,想象一下代码生成只需要这么简单是难以置信的。如今,我们有了像Copilot这样的AI协作程序员,带来了编程的乐趣,让开发者能够保持专注,使开发者满意度提高60-75%。
我们还看到了自动化代码文档的IDE插件,如Mintlify,以及用于单元测试的共同驾驶员Codium和用于搜索和理解大型代码库的Buildt。
Replit允许用户直接从浏览器构建、测试和部署代码,而他们的多人游戏和幽灵写手功能增强了代码协作。同时,
Cursor正在为程序员构建一个AI本地IDE体验。Copilot的推广推动了开发者生产力的提升。
7)其它垂域
在法律领域,像Harvey这样的初创公司正在为律师构建共同驾驶员,为他们的工作流程提供强大支持,并投资于建立在知识工作中建立信任的最佳实践系统。随着 AI 不断改变法律行业,我们可能需要重新考虑围绕按小时计费的激励结构,因为关注点转向创造过程和产生的价值。
系统集成商也受益于 AI 的进展。像Distyl这样的服务提供商正在出现,帮助企业提供定制的 AI 解决方案。
正如Ness为全球资本市场提供交易、风险和云服务一样,服务提供商将致力于为在这些联盟中取得成功的金融部门带来生成式 AI 解决方案。
在国防领域,Scale AI与XVIII空降军合作,将LLM首次部署到美国政府的保密网络上。该公司的联邦AI平台Scale Donovan帮助运营人员、分析师和决策者在几分钟内理解、规划和行动,而不是几周。该平台还利用来自人类反馈的强化学习持续优化技术,更好地支持任务目标。
令人鼓舞的是,这种可及性已经触及了印度最偏远的城镇和村庄:一个例子就是KissanAI为印度农民构建了一个助手,通过ASR和LLM API以及农业专家知识为他们提供多语言聊天机器人,使他们能够做出更明智的决策并优化他们的经营。这个项目使国家农业热线得以扩展,并得到了印度政府的支持。
8)消费领域
类似的助手和共同驾驶员式的交互范式正在内容生成、游戏、购物、旅行、金融、消费品、医疗保健、客户服务、语言学习等垂直领域中得到建设。这里只是提及一些我想到的例子(不一定是最好的):
Jasper正在探索面向企业和平台的发展方向,构建一个可以为企业使用的写作助手的智能层。
在旅游领域,Navan已经在他们的产品中整合了OpenAI和ChatGPT,利用他们的虚拟助手Ava来个性化推荐并增加旅行者的参与度。
在语言学习领域,Quazel正在利用LLM,押注于定期练习口语作为学习新语言的最简单方式。类似地,Speak开发了一系列内容体验,允许学习者在英语对话中进行练习,模拟日常场景和交互。
在消费品领域,Turing Labs允许消费品公司使用 AI 快速探索和评估配方理念,通过传统流程比减少了数月的时间。
在游戏领域,Latitude正在构建生成式 AI 游戏,利用生成式 AI 实时创建内容,并允许开发者创建更具吸引力和交互性的游戏体验。Unakin正在为游戏工作室构建一个AI共同驾驶员。
生成模型的非确定性特性可以为游戏开发者和玩家提供灵感。此外,AI与游戏的结合可以丰富非玩家角色(NPC)、开发关卡、帮助管理游戏体验的复杂性和一致性、增强图形效果,并创造强大的故事情节。
最后,在内容创作方面,用户更喜欢用户生成的内容来做出购买决策。随着功能更强大的生成式模型,创建个性化、高质量的内容的成本正在降低。人类喜欢引人入胜的故事,像Tome这样的初创公司让每个人都能讲一个引人入胜的故事。
这个年度的AI 50名单(由Sequoia可视化)只是对这些垂直领域和未来工作的一瞥。
随着对于利用LLM供应商创建壁垒的疑虑渐渐消退,我们意识到平台并不能保证平等。这就像游戏主机已经存在几十年了,但游戏开发者仍然在竞相开发最具沉浸感的游戏。这突显了关注创业公司能带来的独特价值的重要性,而不是仅仅依赖于底层平台。
颠覆和创新者的困境是不断重复和无法否认的现象,创业公司在探索这个新领域的复杂性中发挥着关键作用。处于这个领域的建设者们在询问,在他们抵达这个拐点时需要记住哪些重要事项。
这里有一个希望更容易记住的框架:AI-IMPACT框架,我相信它将有助于引导建设者追求AI-enabled 和AI-native的产品,让人们喜爱,快速交付并形成紧密的反馈循环,同时建立一个数据飞轮。以下是该框架的几个要点:
1/ Authenticity 真实性:建立独特的声音和价值主张。专注于解决问题的专业知识和解决方案,而不仅仅依赖底层平台。真实性应该来自问题、数据和解决方案的独特性,而不是基础的基础模型提供商。
2/ Interaction 互动:设计直观、无缝的语言用户界面,符合用户的使用习惯。随着技术的发展,用户界面可能会简化(例如自动驾驶汽车)。设计让人愉悦和信任的界面。
3/ Moonshots 野心目标:追求具有改变行业和重新定义技术互动潜力的雄心勃勃的变革性想法。旨在推出对生活有积极影响的高影响力产品和体验。
4/ Personalization 个性化:利用 AI 根据用户的需求、偏好和目标提供个性化的体验。通过基于数据驱动的洞察力定制产品,提高相关性和参与度。
5/ Alignment 对齐性:确保应用程序和系统与人类的价值观和道德相一致。优先考虑安全、负责任的AI开发以及技术和风险的透明度。在一开始就设定用户的期望,并通过人类参与来管理风险。
6/ Commitment towards shipping 承诺交付:经常并渐进地交付,保持紧密的反馈循环。在快速发展的技术和不断变化的用户行为中保持敏捷和适应性。以用户的喜爱为目标。
7/ Technology Convergence 技术融合:利用 AI 、虚拟现实、量子计算和边缘计算等技术的融合,构建能够推动可行性边界并与用户产生共鸣的以人为中心的解决方案,推动行业的有意义变革。
通过了解客户的问题、转变用户行为,并保持对长期愿景的敏锐关注,初创企业可以利用这股新的动力来重塑世界、造福人类。未来的总市场潜力巨大,如果你拥有真实的声音,有很多方法可以获胜。
高效团队、专注明确愿景并致力于目标的高绩效初创企业,获胜的几率更高。我与最好的创始人和团队合作时发现,他们对问题充满激情,具备较高的情商,不会无意识地基于他们的关联行事,具备第二系统思维,灵活适应,并且习惯于做出长期的大赌注——考虑的是几十年的时间,而不是几天。
我们应该鼓励自己致力于那些潜在上涨空间远远大于被认为真正下降空间的想法;选择赢得胜利而不是赌博以避免损失。
互联网给初创企业带来了比现有企业更多的价值(如亚马逊与书店之间的竞争),移动转变为现有企业创造了新的商机,所以这并没有带来太大的转变。但我相信,由于AI的能力、新的互动范式和用户行为的转变,目前是几十年来初创企业首次有机会打破现有企业的格局。
我认识的每个 AI 从业者都非常兴奋,都在“构建范式”中。为初创企业做好准备吧。我们谈论的是非常规的国内生产总值增长,足以支持普遍基本收入,提高人类生活水平,保护我们的基本权利,延长我们的寿命,使我们更加幸福和满足。
本文来源: 有新Newin,原文标题:《OpenAI Shyamal 分享LLM 创业前沿方向,我们所处的历史阶段,AI-IMPACT框架!》
免责声明:本文不构成任何商业建议,投资有风险,选择需谨慎!本站发布的图文一切为分享交流,传播正能量,此文不保证数据的准确性,内容仅供参考
关键词: