302.AI
-
302.AI 新品发布 | AI头像制作的过程和原理解析
最近302.AI上线了一款新的AI工具——AI头像制作,这一工具能够根据用户提供的人物照片,生成人物一致的多种风格的头像。这些风格包括但不限于复古风、未来感、卡通化、艺术抽象等,还可以自定义风格。今天就给大家分享一下这个工具开发背后的故事,希望可以对相关方向的开发者有一些启发和帮助。 AI头像制作使用指南: 先来看下如何获取并使用这一工具,以下是具体的步骤:…
-
302.AI 基准实验室 | FLUX 1.1 Pro推出Ultra模式,实测揭秘真实效果
11月6日,BlackForestLabs宣布推出FLUX1.1 pro的Ultra模式,添加了新的高分辨率功能,还增加了一个RAW参数,这一参数提升了生成图片的拟真度,让生成的图片摆脱了“AI味”,为用户带来了新的视觉体验。 据官网介绍,FLUX 1.1 Pro Ultra支持高达4兆像素(4MP)的图像生成,这是标准模式的四倍。这一提升使得生成的图像更加…
-
302.AI 实战教程 | Midjourney绘画机器人超详细教程,让你从入门到精通
AI绘画技术正重塑创意产业,Midjourney以其快速、高质量的图像生成能力领先市场,成为提升工作效率和激发创意的关键工具。然而,Midjourney的用户体验尚有提升空间,如依赖Discord平台的复杂交互、网页版体验不佳,以及昂贵且缺乏灵活性的月费会员制度,这些问题都在一定程度上阻碍了用户顺畅使用。 302.AI积极采用前沿AI技术,率先整合Midjo…
-
302.AI 基准实验室 | xAI官宣Grok API开启公测,grok-beta表现能否达到预期?
11月6日,备受瞩目的2024年美国总统选举结果终于揭晓,马斯克公开支持的美国共和党总统候选人特朗普获得最终胜利。 作为特朗普的“榜一大哥”马斯克,是人工智能初创公司xAI的始人之一和主要投资者。在11月4日,xAI刚刚官宣Grok API正式开启公测。 根据xAI公司官方发布的文档,可以看到xAI的API目前只有一个模型——“grok-beta”。 从官方…
-
302.AI 基准实验室 | Anthropic最新模型Claude 3.5 Haiku,与其他模型对比表现如何?
11月5日,Anthropic在社交媒体平台宣布Claude 3.5 Haiku可以通过API访问。Claude 3.5 Haiku是Anthropic公司在10月22日发布的新模型,在许多评估中的性能与 Claude 3 Opus不相上下,而成本和速度却与上一代Haiku相当。 根据官方介绍,Claude 3.5 Haiku 在各种编码、工具使用和推理任务…
-
302.AI 基准实验室 | Stable Diffusion 3.5 VS Flux.1 dev,谁才是开源图像生成模型的王者?
10月22日,Stability AI推出最新图像生成模型Stable Diffusion 3.5,其中包括Stable Diffusion 3.5 Large、Stable Diffusion 3.5 Large Turbo两个版本,并宣布预计在10月29日上线Medium版本。 10月29日,Stable Diffusion 3.5 Medium如期推出…
-
302.AI 实战教程 | Claude升级的PDF解析功能,在302.AI早已支持
11月2日,Anthropic在社交媒体平台宣布,在其Claude 3.5 Sonnet 模型中增加了PDF功能,这一功能不仅能读懂PDF中的文字,还能看懂图表、图片等视觉元素。 目前这一新功能已进入公开测试阶段,用户可以利用该模型来分析PDF文档中的文本和视觉元素(如图像、图表和表格),适用于财务报告、数据分析、法律文件和文档翻译等多种场景。 而这一PDF…
-
302.AI 基准实验室 | 揭秘神秘“小熊猫”模型,实测对比Recraft V3生成效果
近日,一个名为red_panda的模型在Hugging Face的文本生成图像模型排行榜中位居榜首, 这引起了许多网友对这一神秘“小熊猫”背后公司身份的种种讨论。 有网友猜测小熊猫会不会是Midjourney的新产物,也有网友猜测可能是来自OpenAI: 甚至有网友猜测,因为熊猫生活在亚洲,而中国公司在视频生成方面表现卓越,所以猜测它来自像百度或腾讯这样的中…
-
302.AI 新品发布 | 提示语专家工具,让人机交互更精准、更高效
在众多AI产品中,自然语言处理(NLP)技术是连接人类与机器的桥梁。NLP使得机器能够理解、解释和生成人类语言,从而实现更自然、更高效的交互。它允许用户通过文本或语音与AI进行实时对话,获取信息、解决问题或执行任务。 随着对话式交互的广泛普及,提示词(prompt)的精确度对AI产出内容的质量起到直接影响,它们已成为引导AI模型生成预期响应的关键因素。一个好…
-
302.AI 新品发布 | 实时语音便捷方案,让你快速体验AI语音通话
在10月初,OpenAI在旧金山召开了开发者大会。在发布会中,OpenAI推出了Realtime API 的公开测试版。 Realtime API是一种实时多模态API,它允许开发人员构建低延迟、多模态的AI应用体验。这个API背后的技术是GPT-4o模型,它支持音频输入和输出,能够实现超越传统基于文本的AI对话的实时、自然的语音交互。 像Realtime这…