-
Azure Text To Speech(TTS):免费TTS 在线文本转语音工具
Azure Text To Speech(TTS)是什么 Azure Text To Speech (TTS) 是一款免费的在线文本转语音工具,基于 Azure TTS 网页应用。用户可以通过 SSML 微调语音输出,选择语音、语言、风格和角色,并调整语速、语调和音量。该工具支持音频下载和一键本地或云端部署,非常适合希望以最少设置体验 Azure TTS 全功能的用户。 Azure Text To…- 54
- 0
-
Linly-Dubbing:智能视频多语言AI配音/翻译工具
Linly-Dubbing是什么 Linly-Dubbing 是一款智能视频多语言AI配音和翻译工具,融合了YouDub-webui的灵感并进行了优化,集成了Linly-Talker的数字人对口型技术,为用户提供自然的多语言视频体验。Linly-Dubbing 适用于国际教育和全球娱乐内容本地化等场景,助力团队将优质内容传播到全球各地。 Linly-Dubbing主要特点 – 多语言支持:涵盖中文…- 77
- 0
-
AudioNotes:AI音频转文字工具 快速提取音视频内容并转成Markdown笔记
AudioNotes是什么 AudioNotes 是一款 AI 音频转文字工具,基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统,能够快速提取音视频内容,并调用大模型进行整理,生成结构化的 Markdown 笔记,便于快速阅读。AudioNotes核心功能是利用先进的自动语音识别(ASR)技术,能够精准提取音视频中的文本内容,通过大模型整理生成清晰易读的 Markdown 笔记,并…- 115
- 0
-
ChatTTS免费在线使用文本转语音工具 多线路可选-ChatTTS中文版
ChatTTS中文版 ChatTTS中文版(聚合多线路版)是一款ChatTTS免费在线使用文本转语音工具,多线路可选,提供免费真人语音生成工具,聚合多条音频生成线路,Chat TTS专为对话场景而设计,非常适合大型语言模型助手的对话任务,以及对话式音频和视频介绍等应用。该模型支持中文和英文,在语音合成中表现出很高的质量和自然度。这一性能水平是通过在约 100,000 小时的中文和英文数据上进行训练…- 75
- 0
-
FunClip-开源、精准、方便的视频切片工具
FunClip是什么 FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频。 FunClip特色 FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型…- 60
- 0
-
Parler TTS-开源高质量文本转语音 (TTS) 模型
Parler TTS是什么 Parler TTS是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。它是根据Dan Lyth和Simon King在Stability AI和Edinburgh University发表的论文《Natural language guidance of high-fidelity text-…- 45
- 0
-
AI名人语音生成器-语音AI生成实验室VoiceAILabs
语音AI生成实验室VoiceAILabs 语音AI生成实验室VoiceAILabs是一个AI名人语音生成器,提供专业的AI名人语音合成服务,让你能够轻松免费制作个性化语音内容,效果不满意可重新生成,可支持各国常用语言,是最好的AI语音生成,目前拥有全世界各地明星语音生成功能,有明星蔡徐坤、肖战、王一博、陈冠希,歌手孙燕姿、周杰伦、邓紫棋、Lisa,主播PDD、DoinB、小团团等名人语音生成。实用…- 133
- 0
-
Open WebUI-开源功能丰富且用户友好WebUI 支持各种 LLM 运行程序
Open WebUI是什么 Open WebUI是一个可扩展、功能丰富且用户友好的自托管 WebUI,旨在完全离线操作,它支持各种 LLM 运行程序,包括 Ollama 和 OpenAI 兼容的 API,支持使用docker快速部署,感兴趣的同学可以到项目学习。 LLM是什么 大语言模型是一种语言模型,由具有许多参数的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模…- 119
- 0
-
Hume AI-具备人类情感感知的AI对话机器人
Hume AI是什么 Hume AI是一家研究实验室和技术公司,开发了一些自然语言理解工具,可以获取文本、音频、视频或图像,并捕捉情感、动作和其他表达。他们的对话AI产品EVI采用情感大语言模型(eLLM)技术,能够进行流畅的对话并感知用户的情绪变化。EVI注重对话的连贯性和自然性,能够像真人一样停下来听用户说话,使对话体验更接近真实的人际交流。Hume AI的EVI凭借其情感感知能力和流畅的对话…- 82
- 0
-
AI视频生成器 利用大模型-一键生成短视频-MoneyPrinterTurbo
MoneyPrinterTurbo是什么 MoneyPrinterTurbo是一个AI视频生成器,利用大模型,一键生成短视频,只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。由于该项目的 部署 和 使用,对于一些小白用户来说,还是 有一定的门槛,可以使用项目的实例网站体验。 MoneyPrinterTurbo功能特性 完…- 77
- 0
-
DevHub-功能丰富的实用开发者工具箱 100+工具集合
DevHub是什么 DevHub是一个功能丰富的离线实用开发者工具箱, 目前100+工具集合,包括API请求、正则表达式测试、Chmod计算器、密码生成器、温度转换器、文本转语音、PX/REM转换器、条形码生成器、Wi-Fi二维码生成器等等,经过精心设计,可以为开发人员的日常任务提供支持,同时确保其数据的最大安全性,目前正在积极开发中,DevHub 设定了一个大胆的目标:每周发布更新,非常实用。 …- 51
- 0
-
Suno AI-人工智能AI音乐生成器 一键文本转歌曲
Suno AI是什么 Suno是一款由Anthropic公司开发的人工智能工智能AI音乐生成器/AI音乐和语音生成工具,旨在帮助用户快速创作原创音乐和语音作品。通过分析文本提示中的单词、节奏和声音模式,Suno AI能够生成与歌词节奏和结构相匹配的原创曲调。是一款强大的人工智能音乐生成器,支持多种音乐风格和语言,帮助用户快速创作音乐、语音和音频,目前使用需要注册,可以使用最新的V3模型,可以生成2…- 59
- 0
-
MeloTTS-高质量多语言文本转语音工具
MeloTTS是什么 MeloTTS是由MyShell.ai推出的开源高质量多语言文本转语音库、多语言文本转语音工具,目前支持英语、西班牙语、法语、中文、日语和韩语等等语言。其语音合成速度快,即使在普通CPU上也能实现实时合成,生成高质量、自然流畅的语音输出,提供在线演示的版本。 高质量多语言文本转语音工具 演示地址:https://huggingface.co/spaces/mrfakename…- 51
- 0
-
Bon French-AI 助力小而美的法语辅助学习工具
Bon French是什么 Bon French是一款由AI助力的小而美的法语辅助学习工具。这个工具适用于初学法语的学习者,通过AI能力分析法语句子的成分,加强大脑对语言的认知。它使用了前沿的TTS技术,将句子转换为语音,帮助纠正口音。Bon French还提供了专属的法语单词本和句子收藏夹,方便查阅和复习。此外,它还内置了AI法语老师,通过采访多个法语老师并基于AI模型进行训练,可以快速回答法语…- 46
- 0
-
AI音频视频转文本工具 播客 视频一键转录翻译-Memo AI
Memo AI是什么 Memo AI是一款多功能的AI音频视频和播客转文本工具。它可以将YouTube、播客和本地音频、视频文件转录成文字,并支持多语种之间的翻译,覆盖90多种语言。该工具还提供了诸多核心功能,包括视频转文字、多语言支持、文字翻译、漂浮注释、实时字幕、本地媒体支持、音频剪辑和AI摘要、合成新的语音等。Memo AI支持Windows和macOS桌面设备,并可以导出字幕和Markdo…- 122
- 0
-
OpenVoice-多功能即时AI语音克隆工具
OpenVoice是什么 OpenVoice是一款由MyShell推出的免费开源多功能即时AI语音克隆工具,只需参考说话者的短音频剪辑即可复制其声音,并且可生成多种语言的语音。除了复制音色,OpenVoice还可以精细控制语音风格,包括情感、口音、节奏、停顿和语调。此外,OpenVoice能够在没有大量说话人训练集支持的情况下实现零样本跨语言语音克隆。此外,OpenVoice还具有高计算效率,其成…- 74
- 0
-
CapHacker-免费无水印AI视频字幕生成器
CapHacker是什么 Cap Hacker是一款免费无水印AI视频字幕生成器,帮助用户轻松高效地为短视频添加字幕,支持99 种不同的语言,CapHacker 免费且比传统字幕工具更好,使用最新AI人工智能技术将语音转换为文本,并且可以将字幕下载为 SRT 文件,内置5 个独特模板,可以更改字体样式、颜色和背景等等,CapHacker 仍在开发中,测试期间免费且无限制使用。 免费无水印AI视频字…- 136
- 0
-
发现优秀的播客 播客推荐-Listen To Something Wonderful
Listen To Something Wonderful是什么 Listen To Something Wonderful是由matter(一款稍后阅读工具)推出的发现优秀的播客的服务,自动推荐优秀值得收听的播客,并且选出有价值的部分提供收听,提供英文字幕,如果觉得感兴趣直接点击即可打开播客主页收听更多内容,对于喜欢收文播客、并且想要学习英文的同学这是一个非常不错的服务。 Matter介绍 Ma…- 79
- 0
-
TTS Online – 免费文字转语音工具 支持160+种声音
TTS Online是什么 TTS Online是一款免费文字转语音工具/文本转语音工具,提供语音合成服务,支持多种语言,包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语等,以及多种语音风格,目前覆盖160+种声音选择,适用于自媒体、有声书、教育等多场景。特色包括二次元语音、OpenAI技术支持、移动端优化、音频翻译及背景音乐合成,完全免费无限制使用。可以用它大声朗读文本和电子书。作为一…- 314
- 0
-
Lobe Chat-开源的高性能聊天机器人框架 支持语音合成、绘画、爬虫、联网等等
Lobe Chat是什么 Lobe Chat是一款开源的高性能聊天机器人框架,支持语音合成、多模态、可扩展的(Function Call)插件系统,支持一键免费部署私人 ChatGPT/LLM 网页应用程序。目前LobeChat 已经支持 OpenAI 最新的 gpt-4-vision 支持视觉识别的模型,支持文字转语音(Text-to-Speech,TTS)和语音转文字(Speech-to-Te…- 133
- 0
-
18个国外大模型和188个中国大模型列表-LLMs-In-China
LLMs-In-China LLMs-In-China,是一个收集了18个国外大模型和188个中国大模型列表的GitHub仓库,主要是在记录中国大模型发展情况,同时持续深度分析开源开放的大模型以及数据集的情况,对于国内的大模型收集比较详细,包括AI大模型的名称、模型,类别、来源省份城市和说明信息。 大模型是什么 大模型(Large Language Models)是指具有大量参数和计…- 82
- 0
-
Instagram、TikTok、Twitter视频下载器-InstaTweets
InstaTweets是什么 InstaTweets是个Telegram视频下载机器人(Instagram、TikTok、Twitter视频下载器),可以从 Instagram、TikTok、Twitter下载视频到本地,而且甚至可以将语音笔记转换为文本(目前仅支持俄语语音),实用简单直接复制粘贴链接即可下载。,每条消息仅支持一个链接。 Instagram、TikTok、Twitter视频下载器 …- 150
- 0
-
Vditor-易于使用的 Markdown 编辑器 即时渲染 支持所见即所得(富文本)
Vditor Vditor是一款浏览器端易于使用的 Markdown 编辑器,支持所见即所得(富文本)、即时渲染(类似 Typora)和分屏预览模式,为适配不同的应用场景而生。它使用 TypeScript 实现,支持原生 JavaScript、Vue、React、Angular,提供桌面版。支持大纲、数学公式、脑图、图表、流程图、甘特图、时序图、五线谱、多媒体、语音阅读、标题锚点、代码高亮及复制、…- 68
- 0