Tính năng Hiệu năng Tài liệu Blog Changelog

Hướng dẫn sử dụng - Dudu Local Voices

Chào mừng bạn đến với tài liệu chính thức của Dudu Local Voices - Công nghệ chuyển đổi văn bản thành giọng nói (TTS) tiếng Việt 100% offline và bảo mật tối đa.

Sound wave visualization

download_for_offline Cài đặt hệ thống

Dudu Local Voices được thiết kế để chạy trực tiếp trên thiết bị của bạn mà không cần kết nối internet. Hãy làm theo các hướng dẫn cài đặt sau cho hệ điều hành tương ứng của bạn.

laptop_windows Windows Setup

  • 01. Tải bộ cài .exe từ trang chủ.
  • 02. Chạy chương trình với quyền Administrator.
  • 03. Đợi hệ thống giải nén các mô hình ngôn ngữ.

laptop_mac macOS Setup

  • 01. Tải file .dmg tương thích (Intel/Apple Silicon).
  • 02. Kéo file ứng dụng vào thư mục Applications.
  • 03. Mở và cấp các quyền Accessibility cần thiết.
lightbulb

Mẹo tối ưu hiệu năng:

Sử dụng card đồ họa GPU NVIDIA cùng với driver CUDA mới nhất sẽ giúp tốc độ xử lý nhanh hơn gấp 5 lần so với CPU.

graphic_eq Sử dụng Text-to-Speech

Giao diện người dùng được thiết kế tối giản, tập trung vào trải nghiệm gõ và nghe. Bạn có thể điều chỉnh âm điệu, tốc độ và lựa chọn giọng đọc từ nhiều vùng miền khác nhau ngay trong bảng điều khiển chính.

TTS dashboard screenshot
graphic_eq
Neural Synthesis Engine

Xử lý ngôn ngữ tự nhiên cấp độ cao, nhận diện chuẩn xác ngữ điệu tiếng Việt.

speed
Real-time Inference

Độ trễ xử lý cực thấp dưới 200ms cho phản hồi phát âm tức thì khi gõ.

record_voice_over Voice Cloning

Chỉ với 30 giây dữ liệu mẫu giọng đọc, Dudu Local Voices TTS có thể học và tái tạo hoàn chỉnh âm sắc, cảm xúc và ngữ điệu cá nhân cho riêng bạn.

mic

1. Ghi âm mẫu

upload

2. Import dữ liệu

model_training

3. Trích xuất AI

play_circle

4. Tạo giọng mới

keyboard_command_key Phím tắt nhanh

Thao tác Phím tắt
Đọc văn bản đang chọn (Play) Alt + S
Dừng/Tiếp tục đọc (Stop/Play) Space
Sao chép kết quả tệp âm thanh Ctrl + Shift + C
Mở nhanh thư viện giọng nói Alt + V

terminal API Reference

Tích hợp Dudu Local Voices trực tiếp vào ứng dụng của bạn cực kỳ dễ dàng thông qua REST API cục bộ (Localhost) chạy ngoại tuyến.

POST http://localhost:5000/v1/synthesize
{
  "text": "Xin chào, đây là giọng nói từ Dudu Local Voices AI.",
  "voice_id": "vn_male_01",
  "speed": 1.0,
  "pitch": 1.0
}