自 ChatGPT 火爆出圈以来,各式大模型与生成式 AI 技术喷涌而出,医疗、金融、出行、消费零售、互联网等各个行业都在寻找利用生成式AI 技术赋能业务创新的方法。然而,从摸索到落地,企业在应用用生成式 AI 技术尚存在门槛,使用现成的技术服务又会产生安全等方面的顾虑,比如业务数据泄漏等问题。一时间,许多企业陷入进退两难的境地。本篇就来说道说道企业在落地生成生式 AI 应用过程中的那些事。
从模型选择到业务安全,生成式 AI 应用诞生的曲折
实际上,生成式 AI 市场经过一年多快速的发展,一方面市场上涌现出很多大模型与配套服务,另一方面,企业面临的难题也在与日俱增。
首先,从模型的选择开始,眼花缭乱的大模型就已经够厂家喝上一壶。5 月 28 日,由中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合相关研究机构编写的《中国人工智能大模型地图研究报告》正式发布,报告显示,我国 10 亿参数规模以上大模型已发布近 80 个。再到 10 月中国新一代人工智能发展战略研究院发布的《2023中国新一代人工智能科技产业发展报告》显示,目前国内大模型总数达 238 个。而据北京经信局数据,截至 10 月初,北京发布大模型数量达 115 个,其中通用大模型 12 个,垂类大模型 103 个。
按照这个发展趋势,“百模大战”或许很快就会升级为“千模大战”。而企业如何选择大模型便会难上加难。在具体应用场景中,企业需要在准确性和性能平衡间作出衡量,有效地比较模型并根据其首选指标找到最佳选择,这就需要深厚的数据科学专业知识,也会耗费大量的人力时间成本。
而模型的选择只是开始,确定模型之后,还需要结合自身业务,做模型的精调、训练等工作。在这一步,公司的业务数据类型与大模型输入所要求的数据类型需要做一定适配,同时输入的数据需要具有代表性、多样性、一致性和可靠性,这样才能实现效果更佳的输出,这便要求企业需要有既懂业务,又懂大模型技术的工程师对数据进行整理。
此外,大模型的精调也需要大量的算力,需要投入大量的资金和时间来购买和维护硬件设备,或者租用云服务,同时基础设施也需要长时间的维护。而大模型技术作为新兴技术,许多公司并没有相应的人才储备与经验,这对企业来说也是不小的压力。
模型本身的问题解决了之后,企业还要面临安全隐患。比如很多使用方会担心,用了某个大模型,那么自己的数据会不会都被模型方看到甚至泄露?会不会导致敏感信息泄漏,或是生成违规内容等等?那么,企业就需要确保数据在传输、存储和处理的过程中不会被泄露或者滥用,以免给业务和声誉带来损失。
亚马逊云科技助力企业安全构建生成式 AI 应用
面对种种挑战,对于许企业来说,最佳选择可以是给自己找一个 AI 助手,全方面辅助完成 AI 能力的嵌入,最常见的便是云上大模型平台和服务。
2023年11月28日,2023亚马逊云科技 re:Invent 在美国拉斯维加斯盛大开启,并于12月2日圆满落下帷幕。2023年12月12日起,2023亚马逊云科技re:Invent 中国行城市巡展活动将在10大城市开启,覆盖北京、上海、广州、深圳、成都、青岛、南京、西安、杭州、长沙10个城市!
作为全球云计算领域的年度风向标,2023 亚马逊云科技 re:Invent 为全球云计算爱好者和构建者带来了最新的产品和技术发布、最前沿的领导者洞察和全球云计算的最佳实践。在今年 re:Invent 中,一系列重磅发布成为大会焦点,从 Serverless、生成式AI时代的数据战略、芯片与云底座创新,到 Amazon Bedrock 的重磅更新、企业级生成式AI 应用 (Amazon Q) 的全新发布等等,系列组合拳为企业落地生成式 AI 应用全方位护航。
在多个新发布的动作中,一项全面托管服务的重磅更新引人注目——Amazon Bedrock 发布更多模型选择和全新强大功能。
首先,Amazon Bedrock 上集成了 AI21 Labs、Anthropic、Cohere、Meta、Stability AI 和亚马逊的多种行业领先大语言模型和其他模型,用户可轻松访问。不仅如此,为了帮助客户在纷繁的模型中选择更适合自己的,Amazon Bedrock 新功能可帮助客户高效评估、比较和选择最适合其应用场景和业务需求的模型。
确定模型之后,企业往往需要针对模型做适配,或者说是扩展调优,最大程度地释放数据价值。针对这些部分,Amazon Bedrock 知识库功能使用上下文和相关公司数据定制模型响应:组织希望使用专有数据补充现有模型,以获得更相关和更准确的响应。针对模型调优,Amazon Bedrock 中的 Cohere Command、Meta Llama 2 和 Amazon Titan 模型支持调优,为客户的模型定制提供更多选项,Anthropic Claude 也即将支持调优。
此外,Amazon Bedrock 也兼备代理功能,可以自动执行,使用公司系统和数据源执行多步骤任务。虽然模型能够有效地进行对话和创建新内容,但如果能够执行复杂的操作,例如解决问题以及与公司系统交互以完成任务(例如,旅行预定或订购替换零件),它们可以提供更多价值。然而,这需要定制化地将模型与公司数据源、API以及内部和外部系统集成起来。开发人员必须编写代码来协调模型、系统和用户之间的交互,以便应用程序可以按逻辑顺序执行一系列API调用。为了将模型与数据源连接起来,开发人员必须部署RAG,以便模型可以根据任务调整其响应。最后,开发人员必须配置和管理必要的基础设施,并制定数据安全和隐私策略。这些步骤非常耗时且需要专业知识,从而减慢了生成式AI应用程序的开发速度。现在正式可用、完全托管的Amazon Bedrock代理功能使生成式AI应用程序能够跨公司系统和数据源执行多步骤任务。
最后,在交互安全层面。虽然许多模型使用内置控件来过滤不良和有害内容,但企业希望进一步定制交互,以保证话题始终与业务相关,符合公司政策,并遵守“负责任的 AI”的原则。例如,银行可能希望这样设置其在线助手:避免查询竞争对手、避免提供投资建议、以及限制有害内容。此外,应用户要求,可能要变换或隐去用户的个人身份信息(PII)以保证安全。企业希望以一种简化的方式在生成AI应用程序中强化关键策略和规则,以提供所答即所问的用户体验并支持更安全地使用该技术。Amazon Bedrock 的 Guardrails 功能现已推出预览版,使客户能够为生成式 AI 应用程序实施保护措施。借助Amazon Bedrock的Guardrails功能,客户可以根据应用程序要求和负责任的AI策略跨模型实施保护措施。这些应用程序根据客户应用场景和“负责任的AI”原则进行定制,因此这一功能可以增强用户交互的安全性和隐私性。
目前,亚马逊云科技已经推出多款产品助力企业构建生成式 AI 应用,缓解 AI“焦虑”其中也不乏许多科技界合作伙伴。MongoDB首席产品官Sahir Azam表示:“各行各业越来越多的客户希望利用生成式AI来构建下一代应用程序,但许多人担心数据隐私以及人工智能驱动的系统输出的准确性。为了满足客户的需求,我们将MongoDB Atlas作为Amazon Bedrock的知识库,以便我们的共同客户可以利用其运营数据安全地构建生成式AI应用程序,以符合最终用户期望的信任度和准确性来创建个性化体验。通过这种集成,客户可以访问行业领先的基础模型,并使用MongoDB Atlas Vector Search处理过的数据来创建应用程序,在正确的上下文中提供更多相关的输出。利用Amazon Bedrock知识库中内置的数据隐私最佳实践,客户可以节省在生成式AI运营上花费的时间,从而更专注于技术部署,以在 亚马逊云科技上提供更有吸引力的最终用户体验。”
当然,除了 Amazon Bedrock,2023亚马逊云科技 re:Inven还有许多重磅发布,并且在接下来的2023亚马逊云科技 re:Invent 中国活动中,亚马逊云科技也将对各个新产品新功能做深入解读。