{"success":true,"audio_file":"https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://pr222-testing.zylalabs.com/api/6371/speech+analysis+api/9136/obtain+text?url=https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
साइन अप करने के बाद, प्रत्येक डेवलपर को एक पर्सनल API एक्सेस की असाइन की जाती है, जो अक्षरों और अंकों का एक यूनिक संयोजन होता है, जिसका उपयोग हमारे API एंडपॉइंट तक पहुंचने के लिए किया जाता है। प्रमाणीकरण के लिए भाषण विश्लेषण API के साथ बस अपने बेयरर टोकन को Authorization हेडर में शामिल करें।
| हेडर | विवरण |
|---|---|
Authorization
|
आवश्यक
होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें।
|
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
(वार्षिक बिलिंग के साथ 2 महीने बचाएँ 🎉)
अग्रणी कंपनियों का भरोसा
स्पीच एनालिसिस एपीआई ऑडियो को texto में सटीकता से परिवर्तित करता है जो विभिन्न अनुप्रयोगों में निर्बाध रूप से एकीकृत होता है यह उन्नत स्पीच रिकग्निशन और एआई का उपयोग करके विभिन्न उद्योगों और उपयोग के मामलों के लिए सटीक प्रतिलिपियाँ प्रदान करता है चाहे वह लाइव स्पीच प्रोसेसिंग हो या प्री-रिकॉर्डेड ऑडियो फाइलें यह एपीआई विश्वसनीय और त्रुटि-मुक्त परिवर्तनों को सुनिश्चित करता है
इस एपीआई की एक विशेषता इसकी बहुभाषी समर्थन है जो कई भाषाओं में उच्च-सटीकता वाली प्रतिलिपि बनाने की सुविधा प्रदान करती है यह इसे विभिन्न भाषाई संदर्भों में प्रतिलिपियों की आवश्यकता रखने वाले उपयोगकर्ताओं के लिए एक अनिवार्य उपकरण बनाता है
स्पीच एनालिसिस एपीआई ऑडियो इनपुट से ट्रांसक्राइब किया गया टेक्स्ट लौटाता है आउटपुट में टेक्स्ट फॉर्मेट में पहचानी गई स्पीच शामिल होती है जिसका उपयोग उपशीर्षक दस्तावेज़ीकरण या विश्लेषण जैसे विभिन्न अनुप्रयोगों के लिए किया जा सकता है
प्रतिक्रिया डेटा के प्रमुख क्षेत्र आमतौर पर "परिवर्तित पाठ" के लिए "ट्रांसक्रिप्शन" "भाषा" जो पहचान की गई भाषा को इंगित करती है और "विश्वास" जो ट्रांसक्रिप्शन की सटीकता को दर्शाती है शामिल होते हैं
POST Obtain Text एंडपॉइंट के लिए प्राथमिक पैरामीटर "audio_url" है जो ट्रांसक्राइब किए जाने वाले ऑडियो फ़ाइल का यूआरएल निर्दिष्ट करता है अतिरिक्त पैरामीटर "language" शामिल हो सकते हैं जो ट्रांसक्रिप्शन के लिए इच्छित भाषा को निर्दिष्ट करते हैं
प्रतिक्रिया डेटा JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य जोड़े शामिल हैं मुख्य संरचना में ट्रांसक्रिप्शन भाषा और आत्मविश्वास स्कोर के लिए क्षेत्र शामिल हैं जो अनुप्रयोगों में आसान पार्सिंग और एकीकरण की अनुमति देता है
टीपिकल उपयोग के मामले में वीडियो के लिए सबटाइटल बनाना बैठकों या इंटरव्यू के लिए ट्रांस्क्रिप्ट तैयार करना सुनने में अक्षम उपयोगकर्ताओं के लिए पहुंच को बढ़ाना और विभिन्न उद्योगों में अंतर्दृष्टियों के लिए बोले गए_CONTENT का विश्लेषण करना शामिल है
डेटा सटीकता उन्नत भाषण पहचान एल्गोरिदम और विविध डेटा सेटों पर निरंतर प्रशिक्षण के माध्यम से बनाए रखी जाती है एपीआई गलती को कम करने और ट्रांसक्रिप्शन की विश्वसनीयता को सुधारने के लिए गुणवत्ता जांच भी करता है
उपयोगकर्ता "भाषा" पैरामीटर निर्धारित करके अपनी अनुरोधों को अनुकूलित कर सकते हैं ताकि ट्रांसक्रिप्शन के लिए विशिष्ट भाषाओं को लक्षित किया जा सके यह ऑडियो सामग्री की भाषाई संदर्भ के आधार पर अनुकूलित आउटपुट की अनुमति देता है
मानक डेटा पैटर्न में सही वाक्यों के साथ उचित विराम चिह्न और बड़े अक्षर शामिल होते हैं उपयोगकर्ता ऑडियो गुणवत्ता बोलने वालों के उच्चारण और पृष्ठभूमि शोर के स्तर के आधार पर सटीकता में भिन्नताएं अपेक्षित कर सकते हैं