-
YuanbaoPowerAI 是一款极简而强大的AI对话、AI绘图和AI放大的聚合平台
Yuanbao Power AI介绍 Yuanbao Power AI 是一款极简而强大的 AI 聚合平台,旨在为用户提供便捷的人工智能服务。我们的平台主要提供三大核心功能:AI 对话、AI 绘图和图片放大,帮助您轻松实现各种创意和需求。 1. AI 对话 在 AI 对话功能中,我们整合了当前最热门的对话模型,包括 ChatGPT-4o-mini、ChatGPT 4、ChatGPT 4o、O1-p…- 71
- 0
-
Youtube-Whisper:视频转文字工具
Youtube-Whisper是什么 Youtube-Whisper 是一款基于 Gradio 的视频转文字工具,专门用于将 YouTube 视频或播放列表中的内容转录为高质量的文本,通过 OpenAI 的 Whisper 模型将 YouTube 视频转录为文本,支持多语言转录。用户只需粘贴 YouTube 链接即可完成音频提取和文字转录。其主要特点包括快速转录(3分钟视频约30秒完成)、多语言支…- 48
- 0
-
AI 动画图片生成器:AnimeGen
AnimeGen是什么 AnimeGen是一款在线AI 动画图片生成器,基于 Flux 免费生成并获得图片的AI工具,利用先进的 AI 模型(如 Flux.1)从用户提供的文本提示生成令人惊叹的动漫风格图片,让用户可以轻松实现他们的创意构思,使 AI 动漫生成器成为任何对数字艺术和动漫制作感兴趣者的必备工具。目前这款AI 动画图片生成器暂不支持上下文,请在一个描述里表述清楚,Flux AI 偏好英…- 111
- 0
-
HivisionIDPhoto:轻量级的AI证件照制作工具
HivisionIDPhoto是什么 HivisionIDPhoto是一款轻量级的AI证件照制作工具,利用先进的AI模型和一套完善的模型工作流程,实现对多种用户拍照场景的识别、抠图与证件照生成,支持不同尺寸的标准证件照制作,而且该工具还在开发美颜和智能换正装功能,工具支持Docker 部署。 HivisionIDPhoto如何使用 体验地址:https://swanhub.co/ZeYiLin/H…- 106
- 0
-
Linly-Dubbing:智能视频多语言AI配音/翻译工具
Linly-Dubbing是什么 Linly-Dubbing 是一款智能视频多语言AI配音和翻译工具,融合了YouDub-webui的灵感并进行了优化,集成了Linly-Talker的数字人对口型技术,为用户提供自然的多语言视频体验。Linly-Dubbing 适用于国际教育和全球娱乐内容本地化等场景,助力团队将优质内容传播到全球各地。 Linly-Dubbing主要特点 – 多语言支持:涵盖中文…- 77
- 0
-
Easy Excel-阿里开源、快速、简洁、解决大文件内存溢出的Excel处理工具
Easy Excel是什么 EasyExcel是一个由阿里巴巴开源,基于Java的高性能快速、简洁、解决大文件内存溢出的Excel处理工具,能让你在不用考虑性能、内存的等因素的情况下,快速完成Excel的读、写等功能,Easy Excel旨在解决大文件内存溢出问题,简化Excel的读写操作。性能优越,官方数据显示16M内存23秒即可读取75M的Excel文件,并支持内存占用较大的极速模式。Easy…- 44
- 0
-
卦语AI-免费在线AI占卜 周易起卦工具
卦语AI是什么 卦语AI-周易大衍筮法起卦是一个免费在线AI占卜、周易起卦工具,由传统卜筮 与 现代大语言模型 融合的人工智能应用,采用大语言模型技术,重新解读和应用古老的占卜方法,探索如何将千年卜筮文化通过现代科技手段呈现,使其更加亲近日常生活。工具致力于搭建一个桥梁,连接过去与现在,科技与传统。随着技术的不断进步,我们将不断增加卜筮方法与智能解读结合的范围,逐步探索并融合更多经典卜筮方法。 卦…- 309
- 0
-
AudioNotes:AI音频转文字工具 快速提取音视频内容并转成Markdown笔记
AudioNotes是什么 AudioNotes 是一款 AI 音频转文字工具,基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统,能够快速提取音视频内容,并调用大模型进行整理,生成结构化的 Markdown 笔记,便于快速阅读。AudioNotes核心功能是利用先进的自动语音识别(ASR)技术,能够精准提取音视频中的文本内容,通过大模型整理生成清晰易读的 Markdown 笔记,并…- 115
- 0
-
onnxOCR-基于PaddleOCR轻量级OCR工具 支持80多种语言 推理速度超快
onnxOCR是什么 OnnxOCR 是一个基于 PaddleOCR 重构的轻量级 OCR 模型,脱离了 PaddlePaddle 深度学习训练框架,实现了快速的推理速度。该模型支持超过 80 种语言,转换为 ONNX 模型后推理速度比使用 PaddlePaddle 框架快 4-5 倍。OnnxOCR 可以直接部署,适用于计算能力有限但需要保持准确性的场景,支持 ARM 和 x86 架构的计算机。…- 69
- 0
-
AI图片生成 AI视频生成工具 限免 快手大模型团队自研打造-可灵 AI
可灵 AI 可灵 AI是一款免费的AI图片生成、AI视频生成工具,由国内快手大模型团队自研打造新一代 AI 创意生产力平台,提供高质量的视频生成能力,方便用户轻松高效地创作艺术视频。该模型采用3D时空联合注意力机制,能够生成分辨率高达1080p、时长最长为2分钟(帧率30fps)的高质量视频。可灵大模型结合了与Sora相似的技术路线以及多项自主创新技术,在视频生成方面具有显著优势。目前提供AI图片…- 34
- 0
-
ChatTTS免费在线使用文本转语音工具 多线路可选-ChatTTS中文版
ChatTTS中文版 ChatTTS中文版(聚合多线路版)是一款ChatTTS免费在线使用文本转语音工具,多线路可选,提供免费真人语音生成工具,聚合多条音频生成线路,Chat TTS专为对话场景而设计,非常适合大型语言模型助手的对话任务,以及对话式音频和视频介绍等应用。该模型支持中文和英文,在语音合成中表现出很高的质量和自然度。这一性能水平是通过在约 100,000 小时的中文和英文数据上进行训练…- 75
- 0
-
i18nlocale:AI 翻译工具 将应用程序内容翻译成多种语言 支持200多种语言
i18nlocale是什么 i18nlocale是一款AI 翻译工具,本地 + 轻松的国际化翻译,通过改款本地人工智能翻译工具能够将你的应用程序内容翻译成多种语言,支持200多种语言,工具使用transformer.js和Xenova/nllb-200-distilled-600M 模型构建,以实现浏览器内翻译,翻译功能无需服务器参与,唯一运行的后端相关代码是身份验证,用于启用一些高级功能。 i1…- 76
- 0
-
AI文本和图像生成高质量视频-Dream Machine
Dream Machine是什么 Luma Dream Machine-AI文本和图像生成高质量视频,一款由 Luma Labs 开发的 AI 模型,可以快速将文本和图像制作成高质量、逼真的视频。它利用直接在视频上训练的高效可扩展 transformer 模型,确保生成的内容物理上准确且连贯一致,注册用户每天可生成 10 个视频。 Luma Dream Machine如何使用 官网:https:/…- 93
- 0
-
Copilot for Telegram-微软官方上线Telegram Copilot 机器人
Copilot for Telegram是什么 Copilot for Telegram,微软官方上线Telegram Copilot 机器人,Copilot 是一款由 GPT 模型和 Bing 搜索提供支持的个人生成式 AI 助手,可在 Telegram 中使用。Copilot for Telegram 使用自然语言对一系列主题提供响应,从寻求知识到旅行提示,从体育更新到电影推荐。让 Copil…- 121
- 0
-
FunClip-开源、精准、方便的视频切片工具
FunClip是什么 FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频。 FunClip特色 FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型…- 60
- 0
-
AniTalker-开源照片+音频视频生成器 脸部表情 嘴形同步
AniTalker是什么 AniTalker是一款开源照片+音频视频生成器框架 ,通过身份解耦面部运动编码制作生动且多样化的说话面孔,可将单个静态肖像照片和输入音频转换为具有自然流动动作的动画对话视频,生成的结果的每一列都使用具有相似姿势和表情的相同控制信号,但包含一些随机变化,展示了我们的多样性产生的结果。 AniTalker介绍 AniTalker,这是一个创新框架,旨在从单个肖…- 98
- 0
-
Removebg-免费图片AI背景去除工具 AI抠图
Removebg是什么 Removebg是一个在线免费图片AI背景去除工具、AI背景抠图工具,支持去除人物、产品、动物、汽车、标志等图像的背景去除,免注册使用,直接在浏览器即可,支持 PNG、JPG 和 JPEG 图像文件格式,Removebg 的最大大小限制为 4MB,背景去除是同时采用两个模型进行背景去除,可以选择效果较好的进行下载,也可以进行二次编辑,去除抠出的瑕疵等等操作。 Removeb…- 59
- 0
-
ConsolidatedID:具有多模式细粒度身份保护的肖像生成
ConsolidatedID是什么 ConsolidatedID:具有多模式细粒度身份保留的肖像生成,是一个面部一致性生成项目,给定一些输入 ID 的图像, ConsistentID 可以仅使用单个图像,根据文本提示生成各种个性化 ID 图像,人像生成具有极高的ID保真度,不牺牲多样性、文本可控性,几秒钟内快速定制,无需额外的 LoRA 培训。ConsolidatedID 包含两个关键组件:一个多…- 46
- 0
-
Parler TTS-开源高质量文本转语音 (TTS) 模型
Parler TTS是什么 Parler TTS是一个轻量级的开源高质量文本转语音 (TTS) 模型,可以以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然流畅的语音。它是根据Dan Lyth和Simon King在Stability AI和Edinburgh University发表的论文《Natural language guidance of high-fidelity text-…- 45
- 0
-
Open Source AI Cookbook-开源 AI 指南
Open Source AI Cookbook是什么 Open Source AI Cookbook-开源 AI 指南 (Cookbook) 是一系列 Notebook 的合集,里面展示了如何利用开源工具和模型来开发 AI 应用和解决各种机器学习问题的实际技巧和方法,这些笔记都提供了实际的示例和指导,帮助开发人员利用开源工具和模型来解决机器学习问题并开发AI应用。 开源 AI 指南地址 地址:ht…- 25
- 0
-
Open WebUI-开源功能丰富且用户友好WebUI 支持各种 LLM 运行程序
Open WebUI是什么 Open WebUI是一个可扩展、功能丰富且用户友好的自托管 WebUI,旨在完全离线操作,它支持各种 LLM 运行程序,包括 Ollama 和 OpenAI 兼容的 API,支持使用docker快速部署,感兴趣的同学可以到项目学习。 LLM是什么 大语言模型是一种语言模型,由具有许多参数的人工神经网络组成,使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模…- 119
- 0
-
Hume AI-具备人类情感感知的AI对话机器人
Hume AI是什么 Hume AI是一家研究实验室和技术公司,开发了一些自然语言理解工具,可以获取文本、音频、视频或图像,并捕捉情感、动作和其他表达。他们的对话AI产品EVI采用情感大语言模型(eLLM)技术,能够进行流畅的对话并感知用户的情绪变化。EVI注重对话的连贯性和自然性,能够像真人一样停下来听用户说话,使对话体验更接近真实的人际交流。Hume AI的EVI凭借其情感感知能力和流畅的对话…- 82
- 0
-
Let’s Build AI- 实用AI导航网站
Let’s Build AI Let’s Build AI是一个在线实用AI导航网站,由社区驱动的平台,致力于为 AI 爱好者和开发人员共享资源、工具和知识等等,通过GitHub编辑内容更新,目前包括数据库、模型、开发者工具、ChatGPT提示、图像生成、模型开发等等AI工具资源。 实用AI导航网站 地址:https://letsbuild.ai/ Github:https://github.co…- 37
- 0
-
AI视频生成器 利用大模型-一键生成短视频-MoneyPrinterTurbo
MoneyPrinterTurbo是什么 MoneyPrinterTurbo是一个AI视频生成器,利用大模型,一键生成短视频,只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。由于该项目的 部署 和 使用,对于一些小白用户来说,还是 有一定的门槛,可以使用项目的实例网站体验。 MoneyPrinterTurbo功能特性 完…- 77
- 0