llama_cute_voice_assistant

VC/VC++ 2025-08-10

llama_cute_voice_assistant

动机:许多具有人工智能的语音助手的声音令人不愉快。虽然这可能是个人喜好。我的目标是创建一个更人性化的助手,使您能够插入可爱的动漫角色声音和Vtuber声音。


解决方案图:



如何安装

本指南可能不是最详细的。它需要改进。

步骤1-安装llama_cute_voice_assistant

Windows的安装过程

  1. 安装git https://git**-scm*.com/downloads
  2. 安装CudatoolKit(您只能选择Pytorch支持的CUDA的版本。请参阅此处的支持版本https://py*t*or*ch.org/get-started/locally/)
  3. 安装Miniconda https://docs.c*o**nda.io/en/latest/miniconda.html
  4. 开放Miniconda控制台
  5. 创建新的Conda环境
 conda create --name llama_cute_voice_assistant python=3.11
  1. 激活Conda环境
 conda activate llama_cute_voice_assistant
  1. 克隆项目
 git clone https://*git*hu*b.com/atomlayer/llama_cute_voice_assistant.git
  1. 转到项目目录
 cd llama_cute_voice_assistant
  1. 安装Pytorch
  • 转到https://pytor*ch.**org/get-started/locally/
  • 生成一个为您的系统安装pytorch的命令(命令将是这样的:pip3 install torch torch torchvision torchaudio -index-url https://download.py*t**orch.org/whl/cu118)
  • 执行命令
  1. 安装库
 pip install SpeechRecognition==3.10.0 
pip install pyttsx3==2.90 
pip install soundfile==0.12.1
pip install simpleaudio==1.0.4
pip install pygame==2.5.1
conda install PyAudio
pip install openai-whisper --no-cache-dir
pip install omegaconf==2.3.0
pip install git+https://**github.co*m/openai/whisper.git
conda install -c conda-forge ffmpeg


步骤2-安装Oobabooga文本生成Web UI

  1. https://*git**hub.com/oobabooga/text-generation-webui#one-click-installers

  2. 使用-api参数打开Oobabooga文本生成Web UI。

  3. 在“模型”选项卡上:下载并运行您喜欢的AI模型。

  4. 在聊天设置>“字符”选项卡上:设置您的字符名称和描述。



步骤3-安装实时语音更换器

详细说明-https://www.youtube.com/watch?v=_jxbvstgpoo

  1. 下载https://huggi**ngf*ace.co/wok000/vcclient000/blob/main/mmvcserversio_win_onnxgpu-cuda_v.1.5.3.11.zip

  2. 解开档案

  3. 运行start_http.bat

  4. 加入AI Hub Discord:https://discord.gg/aihub

  5. 转到搜索模型频道

  6. 查找并下载您喜欢的模型

  7. 单击实时语音更改客户端中的编辑按钮

  8. 将模型上传到免费单元格

  9. 调整声音的最佳音调参数。



步骤4 - 安装虚拟麦克风

  1. 下载并安装VB-Cable虚拟音频设备https://*v*b-a*udio.com/cable/

  2. 打开实时语音更换器

  3. 设置音频输入:电缆输出(VB-Audio虚拟电缆)

  1. 按开始按钮


步骤5-更改settings.py文件中的设置

  1. 替换oobabooga_api_name和唤醒单词。
    OOBABOOGA_API_NAME- OOBABOOGA文本生成Web UI中的一个字符的名称(Paremeters>“字符”选项卡)
 oobabooga_api_name = "Lisa"
wake_words = ["lisa"]


如何使用

  1. 在项目文件夹中打开conda控制台
  2. 运行命令:
 python voice_chat.py
  1. 说唤醒单词和助手的命令。

链接

https://githu*b.c*o*m/davabase/whisper_real_time

下载源码

通过命令行克隆项目:

git clone https://github.com/atomlayer/llama_cute_voice_assistant.git