Python के साथ Translation API का इस्तेमाल करना

1. खास जानकारी

1e2217da0416d129.png

Translate API, प्रोग्राम के हिसाब से काम करने वाला ऐसा आसान इंटरफ़ेस उपलब्ध कराता है जिसकी मदद से, किसी भी स्ट्रिंग का अनुवाद डाइनैमिक तौर पर, काम करने वाली किसी भी भाषा में किया जा सकता है. इसके लिए, बेहतर मशीन लर्निंग का इस्तेमाल किया जाता है. इसका इस्तेमाल, सोर्स भाषा की जानकारी न होने पर भी भाषा का पता लगाने के लिए किया जा सकता है.

इस ट्यूटोरियल में, Python के साथ Translation API का इस्तेमाल किया जाएगा. इसमें उपलब्ध भाषाओं की सूची बनाने, टेक्स्ट का अनुवाद करने, और किसी टेक्स्ट की भाषा का पता लगाने का तरीका बताया गया है.

आपको क्या सीखने को मिलेगा

  • अपना एनवायरमेंट सेट अप करने का तरीका
  • उपलब्ध भाषाओं की सूची बनाने का तरीका
  • पाठ का अनुवाद कैसे करें
  • भाषाओं का पता लगाने का तरीका

आपको इन चीज़ों की ज़रूरत होगी

  • Google Cloud प्रोजेक्ट
  • कोई ब्राउज़र, जैसे कि Chrome या Firefox
  • Python का इस्तेमाल करने की जानकारी

सर्वे

इस ट्यूटोरियल का इस्तेमाल कैसे किया जाएगा?

सिर्फ़ इसे पढ़ें इसे पढ़ें और इसमें दिए गए अभ्यास पूरे करें

Python के साथ अपने अनुभव को लेकर, 1 से 5 के स्केल पर आप किस हद तक संतुष्ट हैं?

नौसिखिया मध्यम प्रवीण

Google Cloud की सेवाओं के साथ आपका अनुभव कैसा रहा?

नौसिखिया मध्यम प्रवीण

2. सेटअप और ज़रूरी शर्तें

अपने हिसाब से एनवायरमेंट सेट अप करना

  1. Google Cloud Console में साइन इन करें और नया प्रोजेक्ट बनाएं या किसी मौजूदा प्रोजेक्ट का फिर से इस्तेमाल करें. अगर आपके पास पहले से कोई Gmail या Google Workspace खाता नहीं है, तो आपको एक खाता बनाना होगा.

fbef9caa1602edd0.png

a99b7ace416376c4.png

5e3ff691252acf41.png

  • प्रोजेक्ट का नाम, इस प्रोजेक्ट में हिस्सा लेने वाले लोगों के लिए डिसप्ले नेम होता है. यह एक वर्ण स्ट्रिंग है, जिसका इस्तेमाल Google API नहीं करते. इसे कभी भी अपडेट किया जा सकता है.
  • प्रोजेक्ट आईडी, Google Cloud के सभी प्रोजेक्ट के लिए यूनीक होता है. साथ ही, इसे सेट करने के बाद बदला नहीं जा सकता. Cloud Console, अपने-आप एक यूनीक स्ट्रिंग जनरेट करता है. आम तौर पर, आपको यह जानने की ज़रूरत नहीं होती कि यह स्ट्रिंग क्या है. ज़्यादातर कोडलैब में, आपको अपने प्रोजेक्ट आईडी का रेफ़रंस देना होगा. आम तौर पर, इसे PROJECT_ID के तौर पर पहचाना जाता है. अगर आपको जनरेट किया गया आईडी पसंद नहीं आता है, तो कोई दूसरा आईडी जनरेट किया जा सकता है. इसके अलावा, आपके पास खुद का कोई दूसरा नाम चुनने का विकल्प भी है. इस चरण के बाद, इसे बदला नहीं जा सकता. यह प्रोजेक्ट के दौरान बना रहता है.
  • आपकी जानकारी के लिए बता दें कि तीसरी वैल्यू, प्रोजेक्ट नंबर होती है. इसका इस्तेमाल कुछ एपीआई करते हैं. दस्तावेज़ में इन तीनों वैल्यू के बारे में ज़्यादा जानें.
  1. इसके बाद, आपको Cloud के संसाधनों/एपीआई का इस्तेमाल करने के लिए, Cloud Console में बिलिंग की सुविधा चालू करनी होगी. इस कोडलैब को चलाने के लिए, आपसे कोई शुल्क नहीं लिया जाएगा. इस ट्यूटोरियल के बाद बिलिंग से बचने के लिए, बनाए गए संसाधनों को बंद किया जा सकता है या प्रोजेक्ट को मिटाया जा सकता है. Google Cloud के नए उपयोगकर्ता, 300 डॉलर के मुफ़्त ट्रायल वाले कार्यक्रम में शामिल हो सकते हैं.

Cloud Shell शुरू करना

Google Cloud को आपके लैपटॉप से रिमोट तौर पर इस्तेमाल किया जा सकता है. हालांकि, इस कोडलैब में आपको Cloud Shell का इस्तेमाल करना होगा. यह Cloud में चलने वाला कमांड-लाइन एनवायरमेंट है.

Cloud Shell चालू करें

  1. Cloud Console में, Cloud Shell चालू करें 853e55310c205094.png पर क्लिक करें.

3c1dabeca90e44e5.png

अगर Cloud Shell पहली बार शुरू किया जा रहा है, तो आपको एक इंटरमीडियरी स्क्रीन दिखेगी. इसमें Cloud Shell के बारे में बताया गया होगा. अगर आपको इंटरमीडियरी स्क्रीन दिखती है, तो जारी रखें पर क्लिक करें.

9c92662c6a846a5c.png

Cloud Shell को प्रोवाइड करने और उससे कनेक्ट करने में सिर्फ़ कुछ मिनट लगेंगे.

9f0e51b578fecce5.png

इस वर्चुअल मशीन में, डेवलपमेंट के लिए ज़रूरी सभी टूल लोड होते हैं. यह 5 जीबी की होम डायरेक्ट्री उपलब्ध कराती है और Google Cloud में चलती है. इससे नेटवर्क की परफ़ॉर्मेंस और पुष्टि करने की प्रोसेस बेहतर होती है. इस कोडलैब में, ज़्यादातर काम ब्राउज़र से किया जा सकता है.

Cloud Shell से कनेक्ट होने के बाद, आपको यह दिखेगा कि आपने पुष्टि कर ली है और प्रोजेक्ट आपके प्रोजेक्ट आईडी पर सेट है.

  1. पुष्टि करने के लिए, Cloud Shell में यह कमांड चलाएं:
gcloud auth list

कमांड आउटपुट

 Credentialed Accounts
ACTIVE  ACCOUNT
*       <my_account>@<my_domain.com>

To set the active account, run:
    $ gcloud config set account `ACCOUNT`
  1. gcloud कमांड को आपके प्रोजेक्ट के बारे में पता है या नहीं, इसकी पुष्टि करने के लिए Cloud Shell में यह कमांड चलाएं:
gcloud config list project

कमांड आउटपुट

[core]
project = <PROJECT_ID>

अगर ऐसा नहीं है, तो इसे इस निर्देश से सेट किया जा सकता है:

gcloud config set project <PROJECT_ID>

कमांड आउटपुट

Updated property [core/project].

3. एनवायरमेंट सेटअप करना

Translation API का इस्तेमाल शुरू करने से पहले, एपीआई को चालू करने के लिए Cloud Shell में यह कमांड चलाएं:

gcloud services enable translate.googleapis.com

आपको कुछ ऐसा दिखेगा:

Operation "operations/..." finished successfully.

अब, Translator API का इस्तेमाल किया जा सकता है!

अपने ऐप्लिकेशन में इस्तेमाल करने के लिए, यह एनवायरमेंट वैरिएबल सेट करें:

export PROJECT_ID=$(gcloud config get-value core/project)

echo "PROJECT_ID: $PROJECT_ID"

अपनी होम डायरेक्ट्री पर जाएं:

cd ~

डिपेंडेंसी को अलग करने के लिए, Python वर्चुअल एनवायरमेंट बनाएं:

virtualenv venv-translate

वर्चुअल एनवायरमेंट चालू करने के लिए:

source venv-translate/bin/activate

IPython और Translation API की क्लाइंट लाइब्रेरी इंस्टॉल करें:

pip install ipython google-cloud-translate

आपको कुछ ऐसा दिखेगा:

...
Installing collected packages: ..., ipython, google-cloud-translate
Successfully installed ... google-cloud-translate-3.16.0 ...

अब आपके पास Translation API क्लाइंट लाइब्रेरी का इस्तेमाल करने का विकल्प है!

अगले चरणों में, आपको IPython नाम के इंटरैक्टिव Python इंटरप्रेटर का इस्तेमाल करना होगा. इसे आपने पिछले चरण में इंस्टॉल किया था. Cloud Shell में ipython चलाकर सेशन शुरू करें:

ipython

आपको कुछ ऐसा दिखेगा:

Python 3.10.12 (main, Jul 29 2024, 16:56:48) [GCC 11.4.0]
Type 'copyright', 'credits' or 'license' for more information
IPython 8.27.0 -- An enhanced Interactive Python. Type '?' for help.

In [1]:

नीचे दिए गए कोड को अपने IPython सेशन में कॉपी करें:

from os import environ

from google.cloud import translate


PROJECT_ID = environ.get("PROJECT_ID", "")
assert PROJECT_ID
PARENT = f"projects/{PROJECT_ID}"

अब आपका पहला अनुरोध करने और काम करने वाली भाषाओं की सूची बनाने का समय आ गया है...

4. उपलब्ध भाषाओं की सूची

इस सेक्शन में, आपको Translation API में उपलब्ध सभी भाषाओं की सूची दिखेगी.

उपलब्ध भाषाओं की सूची देखने के लिए, अपने IPython सेशन में यह कोड कॉपी करें:

def print_supported_languages(display_language_code: str):
    client = translate.TranslationServiceClient()

    response = client.get_supported_languages(
        parent=PARENT,
        display_language_code=display_language_code,
    )

    languages = response.languages
    print(f" Languages: {len(languages)} ".center(60, "-"))
    for language in languages:
        language_code = language.language_code
        display_name = language.display_name
        print(f"{language_code:10}{display_name}")
    

फ़ंक्शन को कॉल करें:

print_supported_languages("en")

आपको कुछ ऐसा दिखेगा:

---------------------- Languages: 137 ----------------------
af        Afrikaans
sq        Albanian
am        Amharic
ar        Arabic
hy        Armenian
...
cy        Welsh
xh        Xhosa
yi        Yiddish
yo        Yoruba
zu        Zulu

देखें कि फ़्रेंच में डिसप्ले की भाषा से आपको क्या मिलता है:

print_supported_languages("fr")

आपको वही सूची दिखेगी, जो फ़्रेंच नामों के हिसाब से क्रम में लगाई गई है. यह सूची कुछ इस तरह की होगी:

---------------------- Languages: 137 ----------------------
af        Afrikaans
sq        Albanais
de        Allemand
am        Amharique
en        Anglais
...
vi        Vietnamien
xh        Xhosa
yi        Yiddish
yo        Yoruba
zu        Zoulou

किसी दूसरे भाषा कोड से कोशिश करें.

खास जानकारी

इस चरण में, आपने Translation API में उपलब्ध सभी भाषाओं की सूची बनाई. भाषा से जुड़ी सहायता पेज पर, इस्तेमाल की जा सकने वाली भाषाओं की पूरी सूची देखी जा सकती है.

5. टेक्स्ट का अनुवाद करें

टेक्स्ट का एक भाषा से दूसरी भाषा में अनुवाद करने के लिए, Translation API का इस्तेमाल किया जा सकता है. टेक्स्ट का अनुवाद, बेहतर मशीनी अनुवाद (एनएमटी) मॉडल का इस्तेमाल करके किया जाता है. अगर अनुरोध की गई भाषा के जोड़े के लिए, एनएमटी मॉडल काम नहीं करता है, तो वाक्यांश पर आधारित मशीन ट्रांसलेशन (पीबीएमटी) मॉडल का इस्तेमाल किया जाता है. Google Translate और इसके अनुवाद मॉडल के बारे में ज़्यादा जानने के लिए, एनएमटी की सूचना वाली पोस्ट देखें.

टेक्स्ट का अनुवाद पाने के लिए, अपने IPython सेशन में यह कोड कॉपी करें:

def translate_text(text: str, target_language_code: str) -> translate.Translation:
    client = translate.TranslationServiceClient()

    response = client.translate_text(
        parent=PARENT,
        contents=[text],
        target_language_code=target_language_code,
    )

    return response.translations[0]
    

एक ही टेक्स्ट का अनुवाद अलग-अलग भाषाओं में करने के लिए, फ़ंक्शन को कॉल करें:

text = "Hello World!"
target_languages = ["tr", "de", "es", "it", "el", "zh", "ja", "ko"]

print(f" {text} ".center(50, "-"))
for target_language in target_languages:
    translation = translate_text(text, target_language)
    source_language = translation.detected_language_code
    translated_text = translation.translated_text
    print(f"{source_language}{target_language} : {translated_text}")
    

आपको यह जानकारी मिलनी चाहिए:

------------------ Hello World! ------------------
en → tr : Selam Dünya!
en → de : Hallo Welt!
en → es : ¡Hola Mundo!
en → it : Ciao mondo!
en → el : Γεια σου Κόσμο!
en → zh : 你好世界!
en → ja : 「こんにちは世界」
en → ko : 안녕하세요!

खास जानकारी

इस चरण में, आपने टेक्स्ट का अनुवाद कई भाषाओं में करने के लिए, Translation API का इस्तेमाल किया. टेक्स्ट का अनुवाद करने के बारे में ज़्यादा पढ़ें.

6. भाषाओं का पता लगाना

टेक्स्ट स्ट्रिंग की भाषा का पता लगाने के लिए भी, Translation API का इस्तेमाल किया जा सकता है.

नीचे दिए गए कोड को अपने IPython सेशन में कॉपी करें:

def detect_language(text: str) -> translate.DetectedLanguage:
    client = translate.TranslationServiceClient()

    response = client.detect_language(parent=PARENT, content=text)

    return response.languages[0]
    

अलग-अलग वाक्यों की भाषा का पता लगाने के लिए, फ़ंक्शन को कॉल करें:

sentences = [
    "Selam Dünya!",
    "Hallo Welt!",
    "¡Hola Mundo!",
    "Ciao mondo!",
    "Γεια σου Κόσμο!",
    "你好世界!",
    "「こんにちは世界」",
    "안녕하세요!",
]
for sentence in sentences:
    language = detect_language(sentence)
    confidence = language.confidence
    language_code = language.language_code
    print(
        f"Confidence: {confidence:4.0%}",
        f"Language: {language_code:5}",
        sentence,
        sep=" | ",
    )
    

आपको यह जानकारी मिलनी चाहिए:

Confidence: 100% | Language: tr    | Selam Dünya!
Confidence:  81% | Language: de    | Hallo Welt!
Confidence: 100% | Language: es    | ¡Hola Mundo!
Confidence: 100% | Language: it    | Ciao mondo!
Confidence: 100% | Language: el    | Γεια σου Κόσμο!
Confidence: 100% | Language: zh-CN | 你好世界!
Confidence: 100% | Language: ja    | 「こんにちは世界」
Confidence: 100% | Language: ko    | 안녕하세요!

खास जानकारी

इस चरण में, आपने Translation API का इस्तेमाल करके, टेक्स्ट के किसी हिस्से की भाषा का पता लगाया. भाषाओं का पता लगाने के बारे में ज़्यादा जानें.

7. बधाई हो!

1e2217da0416d129.png

आपने Python का इस्तेमाल करके, Translation API का इस्तेमाल करने का तरीका जाना!

खाली करने के लिए जगह

Cloud Shell में अपने डेवलपमेंट एनवायरमेंट को साफ़ करने के लिए:

  • अगर आप अब भी IPython सेशन में हैं, तो शेल पर वापस जाएं: exit
  • Python वर्चुअल एनवायरमेंट का इस्तेमाल बंद करना: deactivate
  • अपना वर्चुअल एनवायरमेंट फ़ोल्डर मिटाएं: cd ~ ; rm -rf ./venv-translate

Cloud Shell में जाकर, अपना Google Cloud प्रोजेक्ट मिटाने के लिए:

  • अपना मौजूदा प्रोजेक्ट आईडी पाएं: PROJECT_ID=$(gcloud config get-value core/project)
  • पक्का करें कि यह वही प्रोजेक्ट है जिसे आपको मिटाना है: echo $PROJECT_ID
  • प्रोजेक्ट मिटाएं: gcloud projects delete $PROJECT_ID

ज़्यादा जानें

लाइसेंस

इस काम के लिए, Creative Commons Attribution 2.0 जनरल लाइसेंस के तहत लाइसेंस मिला है.