gpt-audio on OpenAI:n puheeseen keskittyvä generatiivinen malli, joka on suunniteltu korkealaatuiseen puhesynteesiin ja audioanalyyseihin. Se voi luoda realistista puhetta eri kielillä ja muuntaa tekstin luonnollisiksi ääniksi erilaisiin käyttötarkoituksiin.
OpenAI:n yleinen nykyinen audiomalli äänen syötteeseen ja tuotokseen keskustelupohjaisissa työnkuluissa.
Mallin tiedot
- Yritys
- OpenAI
- Kategoria
- Kuva ja ääni
- Malliperhe
- Audio
- Konteksti
- 0
- Maksimiulostulo
- 0
- Syöte
- text
- Tuloste
- audio
- Dokumentaatio
- https://platform.openai.com/docs/models/gpt-audio
