IT之家11月11日报道 Tech Media Test Catalog 昨日(11 月 10 日)发布博文报道称,谷歌下一代 AI 成像模型 Nano Banana 2 的预览样本意外泄露,展示了其强大的图像生成和编辑能力。尽管 Nano Banana 2 的预览版在 Media.ai 平台上短暂发布,然后很快被删除,但生成的图像样本已在社交媒体上广泛传播,展示了在锐化低质量照片(图像修复)和执行复杂的色彩编辑指令方面的强大技术实力。根据泄露的信息,Nano Banana 2 带来了两个主要改进。一是解决与物理逻辑相关的视觉任务的能力。例如,在泄露的照片中,模型使用“img2img”技术来准确地展现球的物理轨迹。这是一项复杂的任务,目前其他模型很难完成。 S其次,该模型在渲染文本时效果非常好。基于自然语言线索,可以在白板等媒体上以一致的字体和精确的位置绘制复杂的文本,有效解决了以往模型在图像中生成清晰文本的问题。该媒体还指出,Nano Banana 2 在视觉保真度和命令跟踪功能方面的显着改进表明,其模型中集成了对世界更深入的了解。这一进步使我们不再局限于简单的图像生成,而是能够理解和执行涉及逻辑关系的更复杂的指令。 IT之家附上相关照片如下: 这些先进的功能在设计、媒体创建和自动化工作流程等领域开辟了新的可能性。例如,未来企业将能够通过API接口以编程方式调用模型,快速生成营销海报和社交媒体视觉素材满足他们的需求,这将大大提高内容生产的效率。
特别提示:以上内容(包括图片、视频,如有)均由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。