Whisper on OpenAI:n puheentunnistusmalli (speech-to-text), joka transkriboi ääntä tekstiksi erilaisilla kielillä ja korkealla tarkkuudella. Se soveltuu esimerkiksi videoiden tekstityksiin, muistiinpanoihin ja sovelluksiin, joissa tarvitaan automaattista puheentunnistusta.
Whisper on OpenAI:n vanhempi puheentunnistusmalli, jota uudemmat GPT-4o Transcribe -mallit täydentävät ja monessa käytössä korvaavat.
Mallin tiedot
- Yritys
- OpenAI
- Kategoria
- Kuva ja ääni
- Malliperhe
- Speech-to-text
- Konteksti
- 0
- Maksimiulostulo
- 0
- Syöte
- audio
- Tuloste
- text
- Dokumentaatio
- https://platform.openai.com/docs/models/whisper
