-
Parler TTS-开源高质量文本转语音 (TTS) 模型
Parler TTS是什么 Parler TTS是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。它是根据Dan Lyth和Simon King在Stability AI和Edinburgh University发表的论文《Natural language guidance of high-fidelity text-…- 12
- 0
-
Open Source AI Cookbook-开源 AI 指南
Open Source AI Cookbook是什么 Open Source AI Cookbook-开源 AI 指南 (Cookbook) 是一系列 Notebook 的合集,里面展示了如何利用开源工具和模型来开发 AI 应用和解决各种机器学习问题的实际技巧和方法,这些笔记都提供了实际的示例和指导,帮助开发人员利用开源工具和模型来解决机器学习问题并开发AI应用。 开源 AI 指南地址 地址:ht…- 14
- 0
-
Open WebUI-开源功能丰富且用户友好WebUI 支持各种 LLM 运行程序
Open WebUI是什么 Open WebUI是一个可扩展、功能丰富且用户友好的自托管 WebUI,旨在完全离线操作,它支持各种 LLM 运行程序,包括 Ollama 和 OpenAI 兼容的 API,支持使用docker快速部署,感兴趣的同学可以到项目学习。 LLM是什么 大语言模型是一种语言模型,由具有许多参数的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模…- 20
- 0
-
Hume AI-具备人类情感感知的AI对话机器人
Hume AI是什么 Hume AI是一家研究实验室和技术公司,开发了一些自然语言理解工具,可以获取文本、音频、视频或图像,并捕捉情感、动作和其他表达。他们的对话AI产品EVI采用情感大语言模型(eLLM)技术,能够进行流畅的对话并感知用户的情绪变化。EVI注重对话的连贯性和自然性,能够像真人一样停下来听用户说话,使对话体验更接近真实的人际交流。Hume AI的EVI凭借其情感感知能力和流畅的对话…- 16
- 0
-
Let’s Build AI- 实用AI导航网站
Let’s Build AI Let’s Build AI是一个在线实用AI导航网站,由社区驱动的平台,致力于为 AI 爱好者和开发人员共享资源、工具和知识等等,通过GitHub编辑内容更新,目前包括数据库、模型、开发者工具、ChatGPT提示、图像生成、模型开发等等AI工具资源。 实用AI导航网站 地址:https://letsbuild.ai/ Github:https://github.co…- 17
- 0
-
AI视频生成器 利用大模型-一键生成短视频-MoneyPrinterTurbo
MoneyPrinterTurbo是什么 MoneyPrinterTurbo是一个AI视频生成器,利用大模型,一键生成短视频,只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。由于该项目的 部署 和 使用,对于一些小白用户来说,还是 有一定的门槛,可以使用项目的实例网站体验。 MoneyPrinterTurbo功能特性 完…- 32
- 0
-
Suno AI-人工智能AI音乐生成器 一键文本转歌曲
Suno AI是什么 Suno是一款由Anthropic公司开发的人工智能工智能AI音乐生成器/AI音乐和语音生成工具,旨在帮助用户快速创作原创音乐和语音作品。通过分析文本提示中的单词、节奏和声音模式,Suno AI能够生成与歌词节奏和结构相匹配的原创曲调。是一款强大的人工智能音乐生成器,支持多种音乐风格和语言,帮助用户快速创作音乐、语音和音频,目前使用需要注册,可以使用最新的V3模型,可以生成2…- 35
- 0
-
Bon French-AI 助力小而美的法语辅助学习工具
Bon French是什么 Bon French是一款由AI助力的小而美的法语辅助学习工具。这个工具适用于初学法语的学习者,通过AI能力分析法语句子的成分,加强大脑对语言的认知。它使用了前沿的TTS技术,将句子转换为语音,帮助纠正口音。Bon French还提供了专属的法语单词本和句子收藏夹,方便查阅和复习。此外,它还内置了AI法语老师,通过采访多个法语老师并基于AI模型进行训练,可以快速回答法语…- 28
- 0
-
AI一键将 Figma 设计转换为前端代码-Locofy
Locofy是什么 Locofy是一款专门为前端开发人员设计的AI工具,推出的一款 Lightning产品,利用AI一键将 Figma 设计转换为前端代码,工具可将 Figma 和 AdobeXD 原型设计转化为适用于移动应用程序和 Web 的可投入生产的前端代码,利用现有的设计工具、技术堆栈和工作流程,将产品的交付速度提高 5-10 倍,从而提高生产力和速度。Lightning 是一款基于该…- 27
- 0
-
UniqMail-免费AI电子邮件工具 让AI帮你写邮件
UniqMail是什么 UniqMail是一款免费的AI电子邮件工具,利用最新的人工智能模型创建个性化电子邮件,用户只需要输入邮件描述,AI即可帮助撰写邮件内容,从离线起草到一键发送一气呵成,非常适用于个性化邮件营销、业务沟通等场景。与其他产品不同之处在于用户可以根据项目需求进行邮件设置,并集成自己的OpenAI密钥或者Google Gemini API 密钥,实现个性化的邮件发送,直接发送邮件避…- 33
- 0
-
Rochat-最强AI聊天机器人 与多种AI角色实时互动
Rochat Rochat是一款最强AI聊天机器人,可让你创建多种AI人工智能角色并与他们实时互动,利用AI技术来促进与虚拟角色互动,通过Rochat,可以轻松创建独特的角色,为故事和动画IP赋予新的生命,使其更加个性化。Rochat搭载了最先进的AI模型,包括GPT-4 Turbo、llama2和Rochat-Character,提供沉浸式且互动性强的体验,让用户能与多元AI人物进行对话,目前支…- 118
- 0
-
开源照片背景去除模型-BRIA Background Removal v1.4
BRIA Background Removal v1.4 BRIA Background Removal(BRIA 背景去除)是由 BRIA.AI 开发的开源照片背景去除模型,经过在精心挑选的数据集上的训练,并可作为非商业用途的开源模型,旨在高效地将各种类别和图像类型的前景与背景分离,提供在线演示,只需上传一张照片即可快速去除照片背景。 开源照片背景去除效果 开源照片背景去除模型 在线演示:htt…- 38
- 0
-
Lepton Search-开源对话式AI搜索引擎 500 行代码构建
Lepton Search是什么 Lepton Search是一款开源对话式AI搜索引擎,使用不到 500 行代码构建的对话式AI搜索引擎,是由原阿里巴巴技术副总裁和AI科学家贾扬清创办的Lepton AI推出的 AI 增强对话式搜索引擎,内置支持大语言模型(LLM)和搜索引擎,默认支持的搜索引擎:Bing 和 Google,能够为用户提供更加准确和深入的答案,Lepton Search 背后使用…- 24
- 0
-
Anytext-多语言视觉AI文本生成工具
Anytext是什么 AnyText是一款在线多语言视觉AI文本生成工具和编辑工具,利用最先进的 AI 技术将简单的文本输入转换为视觉上引人注目的图像,由阿里达摩院发布的文生图最新模型提供支持,目前可以可实现生成与原图风格融为一体的文字或对原图中的文字进行修改,并支持中文。该模型包括辅助的潜在特征模块和文本嵌入模块两个核心部分。辅助的潜在特征模块利用文本字形、位置和蒙版图像等输入,生成用于文本生成…- 44
- 0
-
Danswer-开源AI企业问答工具 支持GPT-4等多种大型模型
Danswer是什么 Danswer是一款开源AI企业问答工具系统、人工智能驱动的搜索引擎,集成了直接问答和生成式AI模型支持的聊天,允许用户针对内部文档提出自然语言问题,并获得由源材料中的引用和参考文献支持的可靠答案,以确保答案的准确性和帮助用户更快的找到需要的信息。同时支持多种大型语言模型(如GPT-4、Mixstral、Llama2),并且工具系统可以连接到许多常用工具,例如 Slack、G…- 36
- 0
-
Outfit Anyone-AI虚拟试穿技术 阿里巴巴集团智能计算研究院开发
Outfit Anyone是什么 Outfit Anyone是一项适合任何服装和任何人的超高质量AI虚拟试穿技术,使用户能够在不真实试穿衣物的情况下尝试不同的时尚款式,是阿里巴巴集团智能计算研究院最新发布的基于条件扩散模型的虚拟试穿技术。 Outfit Anyone-虚拟试穿技术特点 虚拟试穿已成为一项变革性技术,使用户无需亲自试穿衣服即可尝试时尚。然而,现有的方法通常难以生成高保真度和细节一致的…- 110
- 0
-
Seamless-AI文献综述生成器 根据论文描述起草文献综述
Seamless是什么 Seamless是一款AI文献综述生成器工具,能够根据论文描述起草文献综述。通过 Seamless,研究人员可以输入论文描述,Seamless 将生成基于真实论文的文献综述,无缝搜索语义学者科学论文数据库(涵盖已发表的科学著作) ,并将相关论文与用户描述混合在一起以创建文献综述,最后一步是使用 GPT3、GPT-4 等大型语言模型完成。目前Seamless 可以生成任何领域…- 54
- 0
-
Lobe Chat-开源的高性能聊天机器人框架 支持语音合成、绘画、爬虫、联网等等
Lobe Chat是什么 Lobe Chat是一款开源的高性能聊天机器人框架,支持语音合成、多模态、可扩展的(Function Call)插件系统,支持一键免费部署私人 ChatGPT/LLM 网页应用程序。目前LobeChat 已经支持 OpenAI 最新的 gpt-4-vision 支持视觉识别的模型,支持文字转语音(Text-to-Speech,TTS)和语音转文字(Speech-to-Te…- 116
- 0
-
Meta 推出AI图像生成器 根据文字生成图片-Imagine with Meta AI
Imagine with Meta AI Imagine with Meta AI是一个由Meta 推出基于Emu 图像合成模型的AI图像生成器,根据文字生成图片,用户只需要语言描述,就可以自动生成所描述的图片,非常方便。类似于 Stable Diffusion、DALL-E 3 和 Midjourney,根据 AI 模型从训练数据中学到的视觉概念生成新图像。不过使用这个AI图像生成器创建图像需要…- 54
- 0
-
18个国外大模型和188个中国大模型列表-LLMs-In-China
LLMs-In-China LLMs-In-China,是一个收集了18个国外大模型和188个中国大模型列表的GitHub仓库,主要是在记录中国大模型发展情况,同时持续深度分析开源开放的大模型以及数据集的情况,对于国内的大模型收集比较详细,包括AI大模型的名称、模型,类别、来源省份城市和说明信息。 大模型是什么 大模型(Large Language Models)是指具有大量参数和计…- 49
- 0
-
Insanely Fast Whisper-基于OpenAI模型的快速音频转文字工具
Insanely Fast Whisper是什么 Insanely Fast Whisper是一个基于OpenAI Whisper Large v3模型的快速音频转文字工具,能够在不到98秒的时间内转录300分钟(5 小时)的音频,适用于各种不同的应用场景,例如处理长时间的会议录音、采访音频,还是其他类型的音频文件,都能高效完成,而且支持翻译功能,可以在演示站点体验。 Insanel…- 32
- 0
-
Sync labs-视频与任何语言实时口型同步AI工具 唇型同步
Sync labs是什么 Sync Labs是一家研究公司,致力于构建生成视频模型 + 托管制作 API,让你可以将实时地将任何视频与任何语言的音频无缝口型同步,或者插入你自己的应用程序/平台/服务,使用也非常简单,只需要上传视频和音频即可,无需额外复杂操作即可完成将任何视频与任何语言实时口型同步/唇型同步,使用需要注册登录,官网有提供试用,感兴趣的同学可以到网站研究相关的视频口型同步、唇型同步的…- 57
- 0
-
开源AI聚合工具 支持AI 聊天、协作、图像生成-AIdea
AIdea是什么 AIdea是一款开源AI聚合工具,集成了主流大语言模型以及绘图模型的 APP, 目前支持 GPT 以及国产大语言模型通义千问、文心一言等,支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型 APP,采用 Flutter 开发,代码完全开源。 AIdea功能列表 支持 GPT-3.5/4 问答聊天 支持国产模型:通义千问,文心一言 …- 86
- 0
-
Meta新AI模型 SeamlessM4T 在线转录和翻译近100种语言
SeamlessM4T SeamlessM4T是最近宣布推出的AI模型,一种基础的多语言和多任务模型,可以无缝翻译和转录语音和文本。能够自动语音识别近百种语言,支持近 100 种输入和输出语言的语音到文本翻译、语音翻译、文本到文本翻译、文本转语音翻译等等功能。 自动语音识别近百种语言 近 100 种输入和输出语言的语音到文本翻译 语音翻译,支持近100种输入语言和35种(+英语)输出语言 近 10…- 35
- 0