,就在上周,亚马逊云科技最新推出了生成式AI(AIGC)工具Amazon Bedrock、Amazon Titan基础模型,并向个人开发者免费开放AI编程工具Amazon CodeWhisperer等等。详见TechWeb此前报道(亚马逊的大语言模型产品露面 CEO称正加大投资生成式AI)
从OpenAI推出ChatGPT起,到国内百度、阿里等厂商陆续推出AIGC产品,国内外大型语言模型概念和产品大热,大厂间的竞争如火如荼。此番,亚马逊云科技在生成式AI领域一口气推出多项新服务,自然引发业内人士关注。
亚马逊云科技新推出的系列AIGC产品和服务
新推出的生成式AI工具Amazon Bedrock有哪些能力?它和目前市面上的AIGC产品定位有何不同?
企业用户能如何使用Amazon Bedrock来满足自身的AIGC服务需求?
和亚马逊云科技的机器学习神器Amazon SageMaker相比,Amazon Bedrock的服务侧重点在哪儿,二者能如何协调?……
带着这样一些问题,TechWeb同亚马逊云科技相关技术团队人员进行了交流,以期理清上述问题。
1、新推出的生成式AI工具Amazon Bedrock有哪些能力?怎么用?
此次亚马逊云科技推出的Amazon Titan基础模型包括两个全新的大语言模型:
第一个是针对总结、文本生成、分类、开放式问答和信息提取等任务的生成式大语言模型;
第二个是文本嵌入大语言模型,能够将文本输入(字词、短语甚至是大篇幅文章)翻译成包含语义的数字表达(即embeddings 嵌入编码)。
Amazon Bedrock这项新服务是一项全新的全托管服务,它允许用户通过API访问亚马逊云科技和第三方基础模型提供商的预训练基础模型
目前,Amazon Bedrock支持API访问的基础模型共有5款,分别是来自AI21 Labs、Anthropic、Stability AI这3家第三方合作伙伴的基础模型,以及亚马逊新发布的Amazon Titan的2款基础模型。
提醒一下,Stability AI就是目前在全球非常火爆的AI绘画工具Stable Diffusion的公司。该公司推出了开源AIGC模型Stable Diffusion。利用这一模型,即便是完全不具备绘画能力的人,只需要提供一段文字描述,就可以创作出精妙绝伦的绘画作品。Stable Diffusion自2022年8月推出以来,已经被全球超过20万开发者下载和授权,也受到国内开发者的广泛追捧。
亚马逊云科技大中华区产品部总经理陈晓建表示,Amazon Bedrock是客户使用基础模型构建和扩展生成式AI应用程序的最简单方法,降低了所有开发者的使用门槛。
陈晓建认为Amazon Bedrock具备五个特点:
一、全托管的体验:Bedrock通过API提供无服务器的托管体验,客户无需担心实例类型、网络拓扑和端点等基础设施细节。
二、轻松定制:客户只要在Amazon S3中提供少量带标签的示例,就可以轻松定制Bedrock的基础模型,用于其特定用例。
三、以隐私思维构建:用于模型微调的客户专有数据不会用于训练基础模型,确保客户的工作成果不会让其它客户受益。
四、Amazon Titan基础模型:Bedrock可以独家访问亚马逊云科技开发的最先进基础模型。
五、客户选择权:客户可以在亚马逊云科技和第三方合作伙伴的多个不同基础模型之间进行选择,这些基础模型都可以进一步定制以支持其特定用例。
2、Amazon Bedrock vs Amazon SageMaker? 还是 Amazon Bedrock amp;Amazon SageMaker?
事实上,亚马逊云科技旗下的人工智能和机器学习(ML)服务Amazon SageMaker已经为AI开发人员所熟悉。
2017年,在亚马逊云科技 re:Invent 全球大会上,Amazon SageMaker首次亮相。Amazon SageMaker推出了全球首个用于机器学习的集成开发环境,它使得不论是开发人员、数据科学家、还是商业分析师都能够快速、轻松地准备数据,并在规模上构建、训练和部署高质量的机器学习模型,大大降低了机器学习的使用门槛。
那么,这次亚马逊云科技推出的AIGC工具Amazon Bedrock和Amazon SageMaker之间是一种什么关系呢?
对此,亚马逊云科技大中华区数据技术专家团队总监王晓野向TechWeb介绍道:
Amazon Bedrock和Amazon Sagemaker是两个独立的服务。
Amazon SageMaker是端到端的机器学习平台,它的功能包括从数据标注到数据训练、再到部署、上线以后的持续监控以及基于原始数据的再迭代等端到端的能力。在生成式AI大模型出现之前,它就已经非常成熟的在帮助客户解决问题了。
Amazon Bedrock的定位是要解决以下几个核心的问题:
一是能帮客户快速找到行业领先模型,并通过API的方式尽可能的不用客户自己去管理底层硬件和运维即可访问。
二是,用户采用Amazon Bedrock做模型调优和训练的时候,和使用Amazon SageMaker的区别是,Amazon SageMaker首先是面向数据科学家,需要编写代码并提供数据以及添加参数去做模型和调优。从应用形式上,在Bedrock里面,客户只需要提供20个已经标注好的数据,就可以很快展开,不需要编写太多的代码。
另外,在部署集成方面,Amazon SageMaker和Bedrock还有一些结合点。事实上SageMaker的某些功能可以被复用到Bedrock训练出来的模型上面。比如客户通过Bedrock自己定制了一个模型出来,新的模型在应用的时候,模型管理的流程是可以互通的。客户可以将基础模型与 Amazon SageMaker 机器学习功能集成,使用 Experiments 测试不同模型和使用Pipelines 大规模管理基础模型等等。
王晓野总结认为,二者基本的区分如果画一下用户画像的话,SageMaker是针对专业人员,Bedrock是尽可能降低门槛,让偏向于行业的场景用户能够更好的用起来。
陈晓建补充道,Bedrock作为一个新的、生成式AI的生产工具,依托于现有的五个已经预设的基础模型,通过API直接调用,生成更多的内容。 Amazon SageMaker是全方位的、全功能化的机器学习工具,包括数据标注到训练到推理,整个能力都是具备的,同时它也有一些预设的能力。你可以根据需要选择适用的场景。
也就是说,Bedrock只是在生成式AI领域,Amazon SageMaker是针对所有机器学习和人工智能领域。生成式AI只是AI的一部分,而Amazon SageMaker是面向整个AI/ML的。
3、亚马逊云科技如何定位自己的AICG产品和服务?
陈晓建表示,在人工智能、机器学习和堆栈这三个层级,亚马逊云科技都拥有非常多的产品组合,我们一直利用人工智能和机器学习技术赋能千行百业。
这次在生成式AI领域发布多项新服务,陈晓建称,亚马逊云科技同样致力于推动技术的普惠化:希望将生成式AI技术从研究和实验领域释放出来,不只让少数初创公司和资金雄厚的大型科技公司,而是让更多公司都能从中受益。我们的使命是让各种技能水平的开发人员和各种规模的组织都有机会使用生成式 AI 进行创新。
谈及“普惠”,陈晓建举例称,此次除了推出AIGC具体产品和服务Amazon Bedrock和Amazon Titan基础模型外,亚马逊云科技还宣布基于Amazon Trainium芯片的新型Trn1n实例正式可用,该实例将网络带宽提高了一倍,为训练生成式AI模型提供了更高的性能。同时,基于AI的编程助手Amazon CodeWhisperer正式可用,个人开发者可以免费访问Amazon CodeWhisperer,且没有任何使用限制。
“我们相信,机器学习的新浪潮才刚开始,未来充满了无限的可能,亚马逊云科技也希望能够在这个方面为客户创造更多的价值。”陈晓建强调。