1. खास जानकारी
Translate API, प्रोग्राम के हिसाब से काम करने वाला ऐसा आसान इंटरफ़ेस उपलब्ध कराता है जिसकी मदद से, किसी भी स्ट्रिंग का अनुवाद डाइनैमिक तौर पर, काम करने वाली किसी भी भाषा में किया जा सकता है. इसके लिए, बेहतर मशीन लर्निंग का इस्तेमाल किया जाता है. इसका इस्तेमाल, सोर्स भाषा की जानकारी न होने पर भी भाषा का पता लगाने के लिए किया जा सकता है.
इस ट्यूटोरियल में, Python के साथ Translation API का इस्तेमाल किया जाएगा. इसमें उपलब्ध भाषाओं की सूची बनाने, टेक्स्ट का अनुवाद करने, और किसी टेक्स्ट की भाषा का पता लगाने का तरीका बताया गया है.
आपको क्या सीखने को मिलेगा
- अपना एनवायरमेंट सेट अप करने का तरीका
- उपलब्ध भाषाओं की सूची बनाने का तरीका
- पाठ का अनुवाद कैसे करें
- भाषाओं का पता लगाने का तरीका
आपको इन चीज़ों की ज़रूरत होगी
सर्वे
इस ट्यूटोरियल का इस्तेमाल कैसे किया जाएगा?
Python के साथ अपने अनुभव को लेकर, 1 से 5 के स्केल पर आप किस हद तक संतुष्ट हैं?
Google Cloud की सेवाओं के साथ आपका अनुभव कैसा रहा?
2. सेटअप और ज़रूरी शर्तें
अपने हिसाब से एनवायरमेंट सेट अप करना
- Google Cloud Console में साइन इन करें और नया प्रोजेक्ट बनाएं या किसी मौजूदा प्रोजेक्ट का फिर से इस्तेमाल करें. अगर आपके पास पहले से कोई Gmail या Google Workspace खाता नहीं है, तो आपको एक खाता बनाना होगा.
- प्रोजेक्ट का नाम, इस प्रोजेक्ट में हिस्सा लेने वाले लोगों के लिए डिसप्ले नेम होता है. यह एक वर्ण स्ट्रिंग है, जिसका इस्तेमाल Google API नहीं करते. इसे कभी भी अपडेट किया जा सकता है.
- प्रोजेक्ट आईडी, Google Cloud के सभी प्रोजेक्ट के लिए यूनीक होता है. साथ ही, इसे सेट करने के बाद बदला नहीं जा सकता. Cloud Console, अपने-आप एक यूनीक स्ट्रिंग जनरेट करता है. आम तौर पर, आपको यह जानने की ज़रूरत नहीं होती कि यह स्ट्रिंग क्या है. ज़्यादातर कोडलैब में, आपको अपने प्रोजेक्ट आईडी का रेफ़रंस देना होगा. आम तौर पर, इसे
PROJECT_ID
के तौर पर पहचाना जाता है. अगर आपको जनरेट किया गया आईडी पसंद नहीं आता है, तो कोई दूसरा आईडी जनरेट किया जा सकता है. इसके अलावा, आपके पास खुद का कोई दूसरा नाम चुनने का विकल्प भी है. इस चरण के बाद, इसे बदला नहीं जा सकता. यह प्रोजेक्ट के दौरान बना रहता है. - आपकी जानकारी के लिए बता दें कि तीसरी वैल्यू, प्रोजेक्ट नंबर होती है. इसका इस्तेमाल कुछ एपीआई करते हैं. दस्तावेज़ में इन तीनों वैल्यू के बारे में ज़्यादा जानें.
- इसके बाद, आपको Cloud के संसाधनों/एपीआई का इस्तेमाल करने के लिए, Cloud Console में बिलिंग की सुविधा चालू करनी होगी. इस कोडलैब को चलाने के लिए, आपसे कोई शुल्क नहीं लिया जाएगा. इस ट्यूटोरियल के बाद बिलिंग से बचने के लिए, बनाए गए संसाधनों को बंद किया जा सकता है या प्रोजेक्ट को मिटाया जा सकता है. Google Cloud के नए उपयोगकर्ता, 300 डॉलर के मुफ़्त ट्रायल वाले कार्यक्रम में शामिल हो सकते हैं.
Cloud Shell शुरू करना
Google Cloud को आपके लैपटॉप से रिमोट तौर पर इस्तेमाल किया जा सकता है. हालांकि, इस कोडलैब में आपको Cloud Shell का इस्तेमाल करना होगा. यह Cloud में चलने वाला कमांड-लाइन एनवायरमेंट है.
Cloud Shell चालू करें
- Cloud Console में, Cloud Shell चालू करें
पर क्लिक करें.
अगर Cloud Shell पहली बार शुरू किया जा रहा है, तो आपको एक इंटरमीडियरी स्क्रीन दिखेगी. इसमें Cloud Shell के बारे में बताया गया होगा. अगर आपको इंटरमीडियरी स्क्रीन दिखती है, तो जारी रखें पर क्लिक करें.
Cloud Shell को प्रोवाइड करने और उससे कनेक्ट करने में सिर्फ़ कुछ मिनट लगेंगे.
इस वर्चुअल मशीन में, डेवलपमेंट के लिए ज़रूरी सभी टूल लोड होते हैं. यह 5 जीबी की होम डायरेक्ट्री उपलब्ध कराती है और Google Cloud में चलती है. इससे नेटवर्क की परफ़ॉर्मेंस और पुष्टि करने की प्रोसेस बेहतर होती है. इस कोडलैब में, ज़्यादातर काम ब्राउज़र से किया जा सकता है.
Cloud Shell से कनेक्ट होने के बाद, आपको यह दिखेगा कि आपने पुष्टि कर ली है और प्रोजेक्ट आपके प्रोजेक्ट आईडी पर सेट है.
- पुष्टि करने के लिए, Cloud Shell में यह कमांड चलाएं:
gcloud auth list
कमांड आउटपुट
Credentialed Accounts ACTIVE ACCOUNT * <my_account>@<my_domain.com> To set the active account, run: $ gcloud config set account `ACCOUNT`
- gcloud कमांड को आपके प्रोजेक्ट के बारे में पता है या नहीं, इसकी पुष्टि करने के लिए Cloud Shell में यह कमांड चलाएं:
gcloud config list project
कमांड आउटपुट
[core] project = <PROJECT_ID>
अगर ऐसा नहीं है, तो इसे इस निर्देश से सेट किया जा सकता है:
gcloud config set project <PROJECT_ID>
कमांड आउटपुट
Updated property [core/project].
3. एनवायरमेंट सेटअप करना
Translation API का इस्तेमाल शुरू करने से पहले, एपीआई को चालू करने के लिए Cloud Shell में यह कमांड चलाएं:
gcloud services enable translate.googleapis.com
आपको कुछ ऐसा दिखेगा:
Operation "operations/..." finished successfully.
अब, Translator API का इस्तेमाल किया जा सकता है!
अपने ऐप्लिकेशन में इस्तेमाल करने के लिए, यह एनवायरमेंट वैरिएबल सेट करें:
export PROJECT_ID=$(gcloud config get-value core/project)
echo "PROJECT_ID: $PROJECT_ID"
अपनी होम डायरेक्ट्री पर जाएं:
cd ~
डिपेंडेंसी को अलग करने के लिए, Python वर्चुअल एनवायरमेंट बनाएं:
virtualenv venv-translate
वर्चुअल एनवायरमेंट चालू करने के लिए:
source venv-translate/bin/activate
IPython और Translation API की क्लाइंट लाइब्रेरी इंस्टॉल करें:
pip install ipython google-cloud-translate
आपको कुछ ऐसा दिखेगा:
... Installing collected packages: ..., ipython, google-cloud-translate Successfully installed ... google-cloud-translate-3.16.0 ...
अब आपके पास Translation API क्लाइंट लाइब्रेरी का इस्तेमाल करने का विकल्प है!
अगले चरणों में, आपको IPython नाम के इंटरैक्टिव Python इंटरप्रेटर का इस्तेमाल करना होगा. इसे आपने पिछले चरण में इंस्टॉल किया था. Cloud Shell में ipython
चलाकर सेशन शुरू करें:
ipython
आपको कुछ ऐसा दिखेगा:
Python 3.10.12 (main, Jul 29 2024, 16:56:48) [GCC 11.4.0] Type 'copyright', 'credits' or 'license' for more information IPython 8.27.0 -- An enhanced Interactive Python. Type '?' for help. In [1]:
नीचे दिए गए कोड को अपने IPython सेशन में कॉपी करें:
from os import environ
from google.cloud import translate
PROJECT_ID = environ.get("PROJECT_ID", "")
assert PROJECT_ID
PARENT = f"projects/{PROJECT_ID}"
अब आपका पहला अनुरोध करने और काम करने वाली भाषाओं की सूची बनाने का समय आ गया है...
4. उपलब्ध भाषाओं की सूची
इस सेक्शन में, आपको Translation API में उपलब्ध सभी भाषाओं की सूची दिखेगी.
उपलब्ध भाषाओं की सूची देखने के लिए, अपने IPython सेशन में यह कोड कॉपी करें:
def print_supported_languages(display_language_code: str):
client = translate.TranslationServiceClient()
response = client.get_supported_languages(
parent=PARENT,
display_language_code=display_language_code,
)
languages = response.languages
print(f" Languages: {len(languages)} ".center(60, "-"))
for language in languages:
language_code = language.language_code
display_name = language.display_name
print(f"{language_code:10}{display_name}")
फ़ंक्शन को कॉल करें:
print_supported_languages("en")
आपको कुछ ऐसा दिखेगा:
---------------------- Languages: 137 ---------------------- af Afrikaans sq Albanian am Amharic ar Arabic hy Armenian ... cy Welsh xh Xhosa yi Yiddish yo Yoruba zu Zulu
देखें कि फ़्रेंच में डिसप्ले की भाषा से आपको क्या मिलता है:
print_supported_languages("fr")
आपको वही सूची दिखेगी, जो फ़्रेंच नामों के हिसाब से क्रम में लगाई गई है. यह सूची कुछ इस तरह की होगी:
---------------------- Languages: 137 ---------------------- af Afrikaans sq Albanais de Allemand am Amharique en Anglais ... vi Vietnamien xh Xhosa yi Yiddish yo Yoruba zu Zoulou
किसी दूसरे भाषा कोड से कोशिश करें.
खास जानकारी
इस चरण में, आपने Translation API में उपलब्ध सभी भाषाओं की सूची बनाई. भाषा से जुड़ी सहायता पेज पर, इस्तेमाल की जा सकने वाली भाषाओं की पूरी सूची देखी जा सकती है.
5. टेक्स्ट का अनुवाद करें
टेक्स्ट का एक भाषा से दूसरी भाषा में अनुवाद करने के लिए, Translation API का इस्तेमाल किया जा सकता है. टेक्स्ट का अनुवाद, बेहतर मशीनी अनुवाद (एनएमटी) मॉडल का इस्तेमाल करके किया जाता है. अगर अनुरोध की गई भाषा के जोड़े के लिए, एनएमटी मॉडल काम नहीं करता है, तो वाक्यांश पर आधारित मशीन ट्रांसलेशन (पीबीएमटी) मॉडल का इस्तेमाल किया जाता है. Google Translate और इसके अनुवाद मॉडल के बारे में ज़्यादा जानने के लिए, एनएमटी की सूचना वाली पोस्ट देखें.
टेक्स्ट का अनुवाद पाने के लिए, अपने IPython सेशन में यह कोड कॉपी करें:
def translate_text(text: str, target_language_code: str) -> translate.Translation:
client = translate.TranslationServiceClient()
response = client.translate_text(
parent=PARENT,
contents=[text],
target_language_code=target_language_code,
)
return response.translations[0]
एक ही टेक्स्ट का अनुवाद अलग-अलग भाषाओं में करने के लिए, फ़ंक्शन को कॉल करें:
text = "Hello World!"
target_languages = ["tr", "de", "es", "it", "el", "zh", "ja", "ko"]
print(f" {text} ".center(50, "-"))
for target_language in target_languages:
translation = translate_text(text, target_language)
source_language = translation.detected_language_code
translated_text = translation.translated_text
print(f"{source_language} → {target_language} : {translated_text}")
आपको यह जानकारी मिलनी चाहिए:
------------------ Hello World! ------------------ en → tr : Selam Dünya! en → de : Hallo Welt! en → es : ¡Hola Mundo! en → it : Ciao mondo! en → el : Γεια σου Κόσμο! en → zh : 你好世界! en → ja : 「こんにちは世界」 en → ko : 안녕하세요!
खास जानकारी
इस चरण में, आपने टेक्स्ट का अनुवाद कई भाषाओं में करने के लिए, Translation API का इस्तेमाल किया. टेक्स्ट का अनुवाद करने के बारे में ज़्यादा पढ़ें.
6. भाषाओं का पता लगाना
टेक्स्ट स्ट्रिंग की भाषा का पता लगाने के लिए भी, Translation API का इस्तेमाल किया जा सकता है.
नीचे दिए गए कोड को अपने IPython सेशन में कॉपी करें:
def detect_language(text: str) -> translate.DetectedLanguage:
client = translate.TranslationServiceClient()
response = client.detect_language(parent=PARENT, content=text)
return response.languages[0]
अलग-अलग वाक्यों की भाषा का पता लगाने के लिए, फ़ंक्शन को कॉल करें:
sentences = [
"Selam Dünya!",
"Hallo Welt!",
"¡Hola Mundo!",
"Ciao mondo!",
"Γεια σου Κόσμο!",
"你好世界!",
"「こんにちは世界」",
"안녕하세요!",
]
for sentence in sentences:
language = detect_language(sentence)
confidence = language.confidence
language_code = language.language_code
print(
f"Confidence: {confidence:4.0%}",
f"Language: {language_code:5}",
sentence,
sep=" | ",
)
आपको यह जानकारी मिलनी चाहिए:
Confidence: 100% | Language: tr | Selam Dünya! Confidence: 81% | Language: de | Hallo Welt! Confidence: 100% | Language: es | ¡Hola Mundo! Confidence: 100% | Language: it | Ciao mondo! Confidence: 100% | Language: el | Γεια σου Κόσμο! Confidence: 100% | Language: zh-CN | 你好世界! Confidence: 100% | Language: ja | 「こんにちは世界」 Confidence: 100% | Language: ko | 안녕하세요!
खास जानकारी
इस चरण में, आपने Translation API का इस्तेमाल करके, टेक्स्ट के किसी हिस्से की भाषा का पता लगाया. भाषाओं का पता लगाने के बारे में ज़्यादा जानें.
7. बधाई हो!
आपने Python का इस्तेमाल करके, Translation API का इस्तेमाल करने का तरीका जाना!
खाली करने के लिए जगह
Cloud Shell में अपने डेवलपमेंट एनवायरमेंट को साफ़ करने के लिए:
- अगर आप अब भी IPython सेशन में हैं, तो शेल पर वापस जाएं:
exit
- Python वर्चुअल एनवायरमेंट का इस्तेमाल बंद करना:
deactivate
- अपना वर्चुअल एनवायरमेंट फ़ोल्डर मिटाएं:
cd ~ ; rm -rf ./venv-translate
Cloud Shell में जाकर, अपना Google Cloud प्रोजेक्ट मिटाने के लिए:
- अपना मौजूदा प्रोजेक्ट आईडी पाएं:
PROJECT_ID=$(gcloud config get-value core/project)
- पक्का करें कि यह वही प्रोजेक्ट है जिसे आपको मिटाना है:
echo $PROJECT_ID
- प्रोजेक्ट मिटाएं:
gcloud projects delete $PROJECT_ID
ज़्यादा जानें
- Cloud Translation से जुड़ा दस्तावेज़: https://cloud.google.com/translate/docs
- Google Cloud पर Python: https://cloud.google.com/python
- Python के लिए Cloud क्लाइंट लाइब्रेरी: https://github.com/googleapis/google-cloud-python
लाइसेंस
इस काम के लिए, Creative Commons Attribution 2.0 जनरल लाइसेंस के तहत लाइसेंस मिला है.