மணி

இந்தச் செய்தியை உங்களுக்கு முன்பே படித்தவர்களும் இருக்கிறார்கள்.
புதிய கட்டுரைகளைப் பெற குழுசேரவும்.
மின்னஞ்சல்
பெயர்
குடும்ப பெயர்
நீங்கள் எப்படி தி பெல் வாசிக்க விரும்புகிறீர்கள்?
ஸ்பேம் இல்லை

தேடுபொறிகளால் அட்டவணைப்படுத்தப்பட்ட வலைத்தளங்களின் அரை பில்லியனுக்கும் அதிகமான பிரதிகள் உள்ளன, மேலும் மொத்த வலைப்பக்கங்களின் எண்ணிக்கை பல்லாயிரக்கணக்கான மடங்கு அதிகமாகும். ரஷ்ய மொழி உள்ளடக்கம் முழு இணையத்தில் 6% ஆகும்.

தேவையான உரையை எவ்வாறு விரைவாக மொழிபெயர்ப்பது மற்றும் ஆசிரியரின் நோக்கம் பாதுகாக்கப்படும் வகையில். புள்ளிவிவர உள்ளடக்க மொழிபெயர்ப்பு தொகுதிகளின் பழைய முறைகள் மிகவும் சந்தேகத்திற்குரிய வகையில் செயல்படுகின்றன, ஏனெனில்... வார்த்தைகளின் சரிவு, பதட்டம் போன்றவற்றை துல்லியமாக தீர்மானிக்க இயலாது. வார்த்தைகளின் தன்மையும் அவற்றுக்கிடையேயான தொடர்புகளும் சிக்கலானவை, அதனால்தான் முடிவு சில நேரங்களில் மிகவும் இயற்கைக்கு மாறானது.

இப்போது யாண்டெக்ஸ் தானியங்கி இயந்திர மொழிபெயர்ப்பைப் பயன்படுத்துகிறது, இதன் விளைவாக வரும் உரையின் தரத்தை மேம்படுத்தும். புதிய உள்ளமைக்கப்பட்ட மொழிபெயர்ப்புடன் உலாவியின் சமீபத்திய அதிகாரப்பூர்வ பதிப்பைப் பதிவிறக்கலாம்.

சொற்றொடர்கள் மற்றும் வார்த்தைகளின் கலப்பின மொழிபெயர்ப்பு

Yandex உலாவி மட்டுமே ஒரு பக்கத்தை முழுவதுமாக மொழிபெயர்க்க முடியும், அத்துடன் சொற்கள் மற்றும் சொற்றொடர்களை தனித்தனியாக மொழிபெயர்க்க முடியும். ஒரு வெளிநாட்டு மொழியை அதிகமாகவோ அல்லது குறைவாகவோ பேசும் பயனர்களுக்கு இந்த செயல்பாடு மிகவும் பயனுள்ளதாக இருக்கும், ஆனால் சில சமயங்களில் மொழிபெயர்ப்பு சிரமங்களை எதிர்கொள்கிறது.

சொல் மொழிபெயர்ப்பு பொறிமுறையில் கட்டமைக்கப்பட்ட நரம்பியல் நெட்வொர்க் எப்போதும் ஒதுக்கப்பட்ட பணிகளைச் சமாளிக்கவில்லை, ஏனெனில் அரிய சொற்களை உரையில் உட்பொதித்து வாசிக்கும்படி செய்வது மிகவும் கடினமாக இருந்தது. இப்போது பழைய தொழில்நுட்பங்கள் மற்றும் புதியவற்றைப் பயன்படுத்தி பயன்பாட்டில் ஒரு கலப்பின முறை கட்டமைக்கப்பட்டுள்ளது.

வழிமுறை இதுதான்: நிரல் தேர்ந்தெடுக்கப்பட்ட வாக்கியங்கள் அல்லது சொற்களை ஏற்றுக்கொள்கிறது, பின்னர் அவற்றை நரம்பியல் நெட்வொர்க் தொகுதிகள் மற்றும் புள்ளிவிவர மொழிபெயர்ப்பாளர் இரண்டிற்கும் வழங்குகிறது, மேலும் உள்ளமைக்கப்பட்ட அல்காரிதம் எந்த முடிவு சிறந்தது என்பதைத் தீர்மானித்து பயனருக்கு வழங்குகிறது.

நரம்பியல் நெட்வொர்க் மொழிபெயர்ப்பாளர்

வெளிநாட்டு உள்ளடக்கம் மிகவும் குறிப்பிட்ட முறையில் வடிவமைக்கப்பட்டுள்ளது:

  • தலைப்புகளில் உள்ள வார்த்தைகளின் முதல் எழுத்துக்கள் பெரிய எழுத்துக்களில் எழுதப்பட்டுள்ளன;
  • வாக்கியங்கள் எளிமைப்படுத்தப்பட்ட இலக்கணத்துடன் கட்டமைக்கப்பட்டுள்ளன, சில சொற்கள் தவிர்க்கப்பட்டுள்ளன.

வலைத்தளங்களில் உள்ள வழிசெலுத்தல் மெனுக்கள் அவற்றின் இருப்பிடத்தை கணக்கில் எடுத்துக்கொண்டு பகுப்பாய்வு செய்யப்படுகின்றன, எடுத்துக்காட்டாக, பின் என்ற சொல், சரியாக மொழிபெயர்க்கப்பட்ட பின் (திரும்பச் செல்) மற்றும் பின்னோக்கி அல்ல.

மேலே குறிப்பிடப்பட்ட அனைத்து அம்சங்களையும் கணக்கில் எடுத்துக் கொள்ள, டெவலப்பர்கள் கூடுதலாக ஒரு நரம்பியல் நெட்வொர்க்கைப் பயிற்றுவித்தனர், இது ஏற்கனவே ஒரு பெரிய அளவிலான உரைத் தரவைப் பயன்படுத்துகிறது. இப்போது மொழிபெயர்ப்பின் தரம் உள்ளடக்கத்தின் இருப்பிடம் மற்றும் அதன் வடிவமைப்பால் பாதிக்கப்படுகிறது.

பயன்படுத்தப்பட்ட மொழிபெயர்ப்பின் முடிவுகள்

மொழிபெயர்ப்பின் தரத்தை BLEU* அல்காரிதம் மூலம் அளவிட முடியும், இது இயந்திர மொழிபெயர்ப்பு மற்றும் தொழில்முறை மொழிபெயர்ப்பு ஆகியவற்றை ஒப்பிடுகிறது. தர அளவுகோல் 0 முதல் 100% வரை.

சிறந்த நரம்பியல் மொழிபெயர்ப்பு, அதிக சதவீதம். இந்த வழிமுறையின்படி, யாண்டெக்ஸ் உலாவி 1.7 மடங்கு சிறப்பாக மொழிபெயர்க்கத் தொடங்கியது.

ஆழ்ந்த கற்றலுடன் ரஷ்ய மொழியை மொழிபெயர்ப்புடன் இணைக்கும் Google Translate பற்றிய செய்திகளுக்கு இந்தக் குறிப்பு ஒரு பெரிய வர்ணனையாகும். முதல் பார்வையில், எல்லாம் ஒலிக்கிறது மற்றும் மிகவும் அழகாக இருக்கிறது. இருப்பினும், "இனி மொழிபெயர்ப்பாளர்கள் தேவையில்லை" என்ற முடிவுக்கு நீங்கள் ஏன் அவசரப்படக்கூடாது என்பதை நான் விளக்குகிறேன்.


தந்திரம் என்னவென்றால், இன்று தொழில்நுட்பத்தால் மாற்ற முடியும்... சரி, யாரையும் மாற்ற முடியாது.
ஒரு மொழிபெயர்ப்பாளர் வெளிநாட்டு மொழி தெரிந்தவர் அல்ல, ஒரு புகைப்படக்காரர் ஒரு பெரிய கருப்பு SLR வாங்கியவர் அல்ல. இது ஒரு அவசியமான நிபந்தனை, ஆனால் போதுமானதாக இல்லை.

மொழிபெயர்ப்பாளர் என்பவர் தனது சொந்த மொழியை நன்கு அறிந்தவர், பிறருடைய மொழியை நன்கு புரிந்து கொண்டு, பொருளின் நுணுக்கங்களை துல்லியமாக தெரிவிக்கக்கூடியவர்.

மூன்று நிபந்தனைகளும் முக்கியமானவை.

இதுவரை நாம் முதல் பாகத்தை கூட பார்த்ததில்லை ("தனது சொந்த மொழி தெரியும்" என்ற வகையில்). சரி, குறைந்தபட்சம் ரஷ்யர்களுக்கு, இதுவரை எல்லாம் மிகவும் மோசமானது. அது ஏதோ ஒன்று, ஆனால் காற்புள்ளிகளை வைப்பது முற்றிலும் அல்காரிதம் செய்யப்பட்டுள்ளது (1994 இல் வேர்ட் இதைச் செய்தது, உள்ளூர்வற்றிலிருந்து அல்காரிதத்திற்கு உரிமம் வழங்கியது), மேலும் தற்போதுள்ள UN உரை கார்பஸின் நரம்பியல் நெட்வொர்க்கிற்கு இது கூரைக்கு அப்பாற்பட்டது.

தெரியாதவர்களுக்கு, அனைத்து உத்தியோகபூர்வ ஐ.நா ஆவணங்களும் ரஷ்ய உட்பட பாதுகாப்பு கவுன்சிலின் நிரந்தர உறுப்பினர்களின் ஐந்து மொழிகளில் வழங்கப்படுகின்றன, மேலும் இந்த ஐந்து நூல்களின் மிக உயர்ந்த தரமான மொழிபெயர்ப்புகளின் மிகப்பெரிய தரவுத்தளமாகும். மொழிகள். "மொழிபெயர்ப்பாளர் ஓஸ்டாப் தண்டிக்கப்படக்கூடிய" கலைப் படைப்புகளின் மொழிபெயர்ப்புகளைப் போலல்லாமல், ஐ.நா. தளமானது நுட்பமான அர்த்தங்களின் மிகத் துல்லியமான பரிமாற்றம் மற்றும் இலக்கிய விதிமுறைகளுடன் சிறந்த இணக்கம் ஆகியவற்றால் வேறுபடுகிறது.

இந்த உண்மையும், அதன் முழுமையான சுதந்திரமும், செயற்கை மொழிபெயர்ப்பாளர்களுக்கு பயிற்சி அளிப்பதற்கான சிறந்த உரைகளின் தொகுப்பாக (கார்பஸ்) ஆக்குகிறது, இருப்பினும் இது முற்றிலும் அதிகாரப்பூர்வ மற்றும் அதிகாரத்துவ மொழிகளின் துணைக்குழுவை மட்டுமே உள்ளடக்கியது.


நமது செம்மறி மொழிபெயர்ப்பாளர்களிடம் திரும்புவோம். பரேட்டோவின் சட்டத்தின்படி, 80% தொழில்முறை மொழிபெயர்ப்பாளர்கள் மோசமானவர்கள். இவர்கள் வெளிநாட்டு மொழிப் படிப்புகளை முடித்தவர்கள் அல்லது சில பிராந்திய கல்வி நிறுவனங்களில் "கிராமப்புறங்களுக்கான ஆரம்பப் பள்ளியின் வெளிநாட்டு மொழி ஆசிரியர்" நிபுணத்துவம் பெற்றவர்கள். மேலும் அவர்களுக்கு வேறு எந்த அறிவும் இல்லை. இல்லையெனில், அவர்கள் குறைந்த ஊதியம் பெறும் வேலைகளில் ஒன்றாக இருக்க மாட்டார்கள்.

எப்படி பணம் சம்பாதிக்கிறார்கள் தெரியுமா? இல்லை, மொழிபெயர்ப்புகளில் இல்லை. ஒரு விதியாக, இந்த மொழிபெயர்ப்புகளின் வாடிக்கையாளர்கள் மொழிபெயர்ப்பாளரை விட வெளிநாட்டு மொழியில் உள்ள உரையை நன்கு புரிந்துகொள்கிறார்கள்.

அவர்கள் சட்டம் மற்றும்/அல்லது உள்ளூர் பழக்கவழக்கங்களின் தேவைகளைப் பின்பற்றுகிறார்கள்.

சரி, நாங்கள் ரஷ்ய மொழியில் தயாரிப்பு வழிமுறைகளை வைத்திருக்க வேண்டும். எனவே, இறக்குமதியாளர் "இறக்குமதி செய்யப்பட்ட" மொழியைக் கொஞ்சம் அறிந்த ஒரு நபரைக் கண்டுபிடித்து, அவர் இந்த வழிமுறைகளை மொழிபெயர்க்கிறார். இந்த நபருக்கு தயாரிப்பு தெரியாது, இந்த பகுதியில் அறிவு இல்லை, அவர் ரஷ்ய மொழியில் "சி-மைனஸ்" வைத்திருந்தார், ஆனால் அவர் மொழிபெயர்க்கிறார். விளைவு அனைவருக்கும் தெரியும்.

அது "எதிர் திசையில்" மொழிபெயர்த்தால் இன்னும் மோசமானது, அதாவது. ஒரு வெளிநாட்டு மொழியில் (சீனர்களுக்கு வணக்கம்). பின்னர் அவரது பணி பெரும்பாலும் எக்ஸ்லரின் "பானிசம்கள்" அல்லது அவற்றின் உள்ளூர் அனலாக்ஸில் விழுகிறது.

அல்லது இங்கே உங்களுக்கு மிகவும் கடினமான வழக்கு உள்ளது. அரசை தொடர்பு கொண்ட போது வெளிநாட்டு ஆவணங்களைக் கொண்ட அதிகாரிகள் இந்த ஆவணங்களின் மொழிபெயர்ப்பைச் சமர்ப்பிக்க வேண்டும். மேலும், மொழிபெயர்ப்பு மாமா வாஸ்யாவிடமிருந்து இருக்கக்கூடாது, ஆனால் சட்டப்பூர்வமாக மதிக்கப்படும் அலுவலகத்திலிருந்து, "ஈரமான" முத்திரைகள் போன்றவை. சரி, சொல்லுங்கள், ஓட்டுநர் உரிமம் அல்லது பிறப்புச் சான்றிதழை "மொழிபெயர்ப்பது" எவ்வளவு கடினம்? அனைத்து புலங்களும் தரப்படுத்தப்பட்டு எண்ணிடப்பட்டுள்ளன. "மொழிபெயர்ப்பாளருக்கு" மிக மோசமான நிலையில், சரியான பெயர்களை ஒரு எழுத்துக்களில் இருந்து மற்றொரு எழுத்துக்கு எழுத்துப்பெயர்ப்பு செய்ய வேண்டும். ஆனால் இல்லை, "மாமா வாஸ்யா" ஓய்வெடுக்கிறார், மேலும் பெரும்பாலும், சட்டத்திற்கு கூட நன்றி இல்லை, ஆனால் உள்ளூர் அதிகாரத்துவ மேலதிகாரிகளின் உள் அறிவுறுத்தல்களுக்கு நன்றி.

80% மொழிபெயர்ப்பு நிறுவனங்கள் நோட்டரிகளால் பணியமர்த்தப்படுகின்றன என்பதை நினைவில் கொள்ளவும். ஏன் என்று மூன்று முறை யூகிக்கவும்?

நல்ல இயந்திர மொழிபெயர்ப்பின் வருகையால் இந்த மொழிபெயர்ப்பாளர்கள் எவ்வாறு பாதிக்கப்படுவார்கள்? வழி இல்லை. சரி, அதாவது. சில சிறிய அம்சங்களில் மொழிபெயர்க்க ஏதேனும் இருந்தால் அவற்றின் மொழிபெயர்ப்புகளின் தரம் இன்னும் மேம்படும் என்ற நம்பிக்கை உள்ளது. அவ்வளவுதான். இங்கே வேலை நேரம் கணிசமாகக் குறையாது, ஏனென்றால் அவர்கள் இன்னும் பெரும்பாலான நேரத்தை நெடுவரிசையிலிருந்து நெடுவரிசைக்கு நகலெடுப்பதில் செலவிடுகிறார்கள். "இந்த பாலாடைக்கட்டி பல புரதங்களைக் கொண்டுள்ளது, பல கார்போஹைட்ரேட்டுகள் ..." தேசிய வடிவங்கள் வெவ்வேறு நாடுகளில் வேறுபட்டவை, எனவே அவர்களுக்கு குறைவான வேலை இருக்காது. குறிப்பாக நீங்கள் முயற்சி செய்யவில்லை என்றால்.

இடைக்கால முடிவு: கீழே உள்ள 80%க்கு எதுவும் மாறாது. அவர்கள் ஏற்கனவே பணம் சம்பாதிப்பது அவர்கள் மொழிபெயர்ப்பாளர்கள் என்பதனால் அல்ல, மாறாக அவர்கள் மிகக் குறைந்த மட்டத்தில் உள்ள அதிகாரத்துவவாதிகள் என்பதால்.

இப்போது ஸ்பெக்ட்ரமின் எதிர் பகுதியைப் பார்ப்போம், அது முதல் 3% ஆக இருக்கட்டும்.

மிகவும் பொறுப்பான, தொழில்நுட்ப ரீதியாக மிகவும் சிக்கலான 1% இல்லாவிட்டாலும்: ஒரே நேரத்தில் மொழிபெயர்ப்பு மிக முக்கியமானதுபேச்சுவார்த்தைகள் பொதுவாக பெரிய நிறுவனங்களுக்கிடையில், ஆனால் வரம்பில் - ஐ.நா அல்லது அதுபோன்ற டாப்ஸ். ஒரு மொழிபெயர்ப்பாளரின் ஒரு தவறு, அர்த்தத்தைக் கூட வெளிப்படுத்தாமல் - உணர்ச்சிகள், மிக மோசமான நிலையில், அணு ஆயுதப் போருக்கு வழிவகுக்கும். அதே நேரத்தில், நீங்கள் புரிந்துகொண்டபடி, வெவ்வேறு மொழிகளில் உள்ள ஒரே மாதிரியான சொற்றொடர்களின் உணர்ச்சி வண்ணம் மிகவும் வித்தியாசமாக இருக்கும். அந்த. மொழிபெயர்ப்பாளர் தனது வேலை மொழிகளின் இரண்டு கலாச்சார சூழல்களையும் நன்கு அறிந்திருக்க வேண்டும். சாதாரணமான உதாரணங்கள் "நீக்ரோ" மற்றும் "ஊனமுற்றோர்". அவர்கள் ரஷ்ய மொழியில் கிட்டத்தட்ட நடுநிலை மற்றும் பிரகாசமாக உணர்ச்சிவசப்பட்டு, ஆபாசமாக, நவீன ஆங்கிலத்தில் உள்ளனர்.

அத்தகைய மொழிபெயர்ப்பாளர்கள் AI பற்றி பயப்படத் தேவையில்லை: அத்தகைய பொறுப்பை யாரும் இயந்திரத்திடம் ஒப்படைக்க மாட்டார்கள்.

அடுத்த 1% இலக்கிய மொழிபெயர்ப்பாளர்கள். சரி, எடுத்துக்காட்டாக, கானன் டாய்ல், லூயிஸ் கரோல், ஹக் லாரி ஆகியோரின் அசல் ஆங்கில மொழிப் பதிப்புகளை கவனமாக சேகரித்து அதற்கென முழு அலமாரியும் என்னிடம் உள்ளது - அசலில், எந்தத் தழுவல்கள் அல்லது எங்கள் உள்ளூர் மறுபதிப்புகள் இல்லாமல். இந்த புத்தகங்களைப் படிப்பது உங்கள் சொற்களஞ்சியத்தை மேம்படுத்துகிறது, உங்களுக்குத் தெரியும், சிறந்த அழகியல் மகிழ்ச்சிக்கு கூடுதலாக. நான், ஒரு சான்றளிக்கப்பட்ட மொழிபெயர்ப்பாளர், இந்த புத்தகங்களில் இருந்து எந்த வாக்கியத்தையும் உரைக்கு மிக நெருக்கமாக மீண்டும் சொல்ல முடியும். ஆனால் மொழிபெயர்ப்பை எடுக்கவா? துரதிருஷ்டவசமாக இல்லை.

கவிதைகளின் மொழிபெயர்ப்புகளை நான் குறிப்பிடவில்லை.

இறுதியாக, தொழில்நுட்ப ரீதியாக மிகவும் கடினமானது (நரம்பியல் நெட்வொர்க்கிற்கு - பொதுவாக சாத்தியமற்றது) 1% அறிவியல் மற்றும் தொழில்நுட்ப மொழிபெயர்ப்பாகும். பொதுவாக, சில நாட்டில் சில குழுக்கள் தங்கள் துறையில் முன்னணியில் இருந்தால், அவர்கள் தங்கள் கண்டுபிடிப்புகள் மற்றும் கண்டுபிடிப்புகளுக்கு தங்கள் மொழியில் பெயரிடுவார்கள். வேறொரு நாட்டில் மற்றொரு குழு சுயாதீனமாக அதையே கண்டுபிடித்தது/கண்டுபிடித்தது என்று மாறிவிடும். எடுத்துக்காட்டாக, பாயில்-மாரியட், மெண்டலீவ்-பாய்சன் சட்டங்கள் மற்றும் போபோவ் / மார்கோனி, மொசைஸ்கி / ரைட் சகோதரர்கள் / சாண்டோஸ்-டுமோன்ட் என்ற தலைப்பில் சர்ச்சைகள் தோன்றின.

ஆனால் வெளிநாட்டு அணி "முற்றிலும் முன்னேறி" இருந்தால், "பிடித்தல்" விஞ்ஞானிகளுக்கு மொழியியல் அர்த்தத்தில் இரண்டு விருப்பங்கள் உள்ளன: தடமறிதல் அல்லது மொழிபெயர்த்தல்.

புதிய தொழில்நுட்பங்களின் பெயர்களை நகலெடுப்பது நிச்சயமாக எளிதானது. அவர்கள் ரஷ்ய மொழியில் இப்படித்தான் தோன்றினார்கள் இயற்கணிதம், மருந்துமற்றும் கணினி, பிரெஞ்சு மொழியில் - பிஸ்ட்ரோ, தாட்சாமற்றும் ஓட்கா; ஆங்கிலத்தில் - செயற்கைக்கோள், டோகாமாக்மற்றும் பெரெஸ்ட்ரோயிகா.

ஆனால் சில சமயங்களில் அவர்கள் இன்னும் மொழிபெயர்க்கிறார்கள். என் தலையில் மனிதாபிமானியின் குரல் காட்டுத்தனமாக பதறுகிறது டச்சோட்டாஃபோரியர் உருமாற்றத்திலிருந்து ஃபோரியர் உருமாற்றத்தின் வாதத்தைக் குறிக்க, ஒரு மொழிபெயர்ப்பாக querquency. நகைச்சுவைகள் ஒருபுறம் இருக்க, கூகுளில் இதுபோன்ற விதிமுறைகள் எதுவும் இல்லை - ஆனால் என்னிடம் டிஜிட்டல் சிக்னல் செயலாக்கம் குறித்த ஒரு காகிதப் பாடப்புத்தகம் உள்ளது, கல்வி அமைச்சகத்தால் அங்கீகரிக்கப்பட்டு, இந்த விதிமுறைகள் உள்ளன.

ஆம், தொடுதிரை பகுப்பாய்வு மட்டுமே (எனக்குத் தெரிந்த) ஆண் குரலை பெண்ணிலிருந்து வேறுபடுத்துவதற்கான ஒரே வழி. விருப்பங்கள்?

நான் புரிந்துகொள்வது என்னவென்றால், இந்த மக்கள் பயப்பட வேண்டியதில்லை, ஏனென்றால் அவர்களே மொழியை உருவாக்குகிறார்கள், புதிய சொற்களையும் சொற்களையும் அறிமுகப்படுத்துகிறார்கள். நரம்பியல் நெட்வொர்க்குகள் தங்கள் முடிவுகளிலிருந்து கற்றுக்கொள்கின்றன. சரி, இந்த விஞ்ஞானிகளும் பொறியாளர்களும் மொழிபெயர்ப்பில் பணம் சம்பாதிப்பதில்லை என்ற உண்மையை மறந்துவிடாமல்.

இறுதியாக, "நடுத்தர வர்க்கம்", நல்ல தொழில்முறை மொழிபெயர்ப்பாளர்கள், ஆனால் சிறந்தவர்கள் அல்ல. ஒருபுறம், அவை இன்னும் அதிகாரத்துவத்தால் பாதுகாக்கப்படுகின்றன - அவை எடுத்துக்காட்டாக, வழிமுறைகளை மொழிபெயர்க்கின்றன, ஆனால் ஹோமியோபதி உணவு சப்ளிமெண்ட்ஸ் அல்ல, ஆனால், எடுத்துக்காட்டாக, சாதாரண மருந்துகள் அல்லது இயந்திரங்களுக்கு. மறுபுறம், இன்று இவர்கள் உயர் தொழிலாளர் ஆட்டோமேஷன் கொண்ட நவீன தொழிலாளர்கள். அவர்களின் பணி ஏற்கனவே சொற்களின் "அகராதியை" தொகுப்பதன் மூலம் தொடங்குகிறது, இதனால் மொழிபெயர்ப்பு ஒரே மாதிரியாக இருக்கும், பின்னர், சாராம்சத்தில், இது டிரேடோஸ் போன்ற சிறப்பு மென்பொருளில் உரையைத் திருத்துவதைக் கொண்டுள்ளது. நரம்பியல் நெட்வொர்க்குகள் தேவையான திருத்தங்களின் எண்ணிக்கையை குறைக்கும் மற்றும் தொழிலாளர் உற்பத்தித்திறனை அதிகரிக்கும், ஆனால் அடிப்படையில் எதையும் மாற்றாது.

சுருக்கமாக, ஒரு சாதாரண மொழிபெயர்ப்பாளரின் தொழிலின் உடனடி மரணம் பற்றிய வதந்திகள் சற்று மிகைப்படுத்தப்பட்டவை. எல்லா நிலைகளிலும், வேலை சிறிது வேகமடையும் மற்றும் போட்டி சிறிது அதிகரிக்கும், ஆனால் அசாதாரணமானது எதுவுமில்லை.

ஆனால் அதைப் பெறுவது மொழிபெயர்ப்பாளர்களும் பத்திரிகையாளர்களும்தான். 10 ஆண்டுகளுக்கு முன்பு, அவர்கள் ஆங்கில மொழி கட்டுரையை எளிதாகக் குறிப்பிடலாம், அதில் இருந்து அவர்களுக்கு எதுவும் புரியவில்லை, மேலும் முழு முட்டாள்தனத்தையும் எழுதலாம். இன்று அவர்களும் முயற்சி செய்கிறார்கள், ஆனால் ஆங்கிலம் தெரிந்த வாசகர்கள் திரும்பத் திரும்ப அவற்றைத் திணிக்கிறார்கள்... உங்களுக்குப் புரியும்.

பொதுவாக, அவர்களின் காலம் கடந்துவிட்டது. மிட்-லெவல் யுனிவர்சல் மெஷின் மொழிபெயர்ப்பாளர் மூலம், கொஞ்சம் விகாரமாக இருந்தாலும், "பத்திரிகையாளர்கள்"

அல்லது அளவு தரமாக உருவாகுமா?

RIF+KIB 2017 மாநாட்டில் ஆற்றிய உரையை அடிப்படையாகக் கொண்ட கட்டுரை.

நரம்பியல் இயந்திர மொழிபெயர்ப்பு: இப்போது மட்டும் ஏன்?

நரம்பியல் நெட்வொர்க்குகள் நீண்ட காலமாகப் பேசப்பட்டு வருகின்றன, மேலும் செயற்கை நுண்ணறிவின் உன்னதமான சிக்கல்களில் ஒன்று - இயந்திர மொழிபெயர்ப்பு - இந்த தொழில்நுட்பத்தின் அடிப்படையில் தீர்க்கப்பட வேண்டும் என்று வெறுமனே கெஞ்சுகிறது.

இருப்பினும், பொதுவாக நரம்பியல் நெட்வொர்க்குகள் மற்றும் குறிப்பாக நரம்பியல் இயந்திர மொழிபெயர்ப்பு பற்றிய வினவல்களுக்கான தேடல்களில் பிரபலத்தின் இயக்கவியல் இங்கே:

நரம்பியல் இயந்திர மொழிபெயர்ப்பு பற்றி சமீப காலம் வரை ரேடாரில் எதுவும் இல்லை என்பது தெளிவாகத் தெரிகிறது - மேலும் 2016 ஆம் ஆண்டின் இறுதியில், கூகிள், மைக்ரோசாப்ட் மற்றும் சிஸ்ட்ரான் உள்ளிட்ட நரம்பியல் நெட்வொர்க்குகளின் அடிப்படையில் பல நிறுவனங்கள் தங்கள் புதிய தொழில்நுட்பங்கள் மற்றும் இயந்திர மொழிபெயர்ப்பு அமைப்புகளை நிரூபித்துள்ளன. அவை கிட்டத்தட்ட ஒரே நேரத்தில், பல வாரங்கள் அல்லது நாட்கள் இடைவெளியில் தோன்றின. அது ஏன்?

இந்த கேள்விக்கு பதிலளிக்க, நரம்பியல் நெட்வொர்க்குகளின் அடிப்படையிலான இயந்திர மொழிபெயர்ப்பு என்ன என்பதைப் புரிந்துகொள்வது அவசியம் மற்றும் இயந்திர மொழிபெயர்ப்புக்கு இன்று பயன்படுத்தப்படும் கிளாசிக்கல் புள்ளிவிவர அமைப்புகள் அல்லது பகுப்பாய்வு அமைப்புகளிலிருந்து அதன் முக்கிய வேறுபாடு என்ன.

நரம்பியல் மொழிபெயர்ப்பாளர் இருதரப்பு தொடர்ச்சியான நரம்பியல் நெட்வொர்க்குகளின் (இருதரப்பு மறுதொடக்க நரம்பியல் நெட்வொர்க்குகள்) ஒரு பொறிமுறையை அடிப்படையாகக் கொண்டது, இது மேட்ரிக்ஸ் கணக்கீடுகளில் கட்டமைக்கப்பட்டுள்ளது, இது புள்ளிவிவர இயந்திர மொழிபெயர்ப்பாளர்களை விட கணிசமாக சிக்கலான நிகழ்தகவு மாதிரிகளை உருவாக்க உங்களை அனுமதிக்கிறது.


புள்ளியியல் மொழிபெயர்ப்பைப் போலவே, நரம்பியல் மொழிபெயர்ப்பிற்கும் பயிற்சிக்கான இணையான கார்பஸ்கள் தேவைப்படுகின்றன, இது தானியங்கு மொழிபெயர்ப்பை "மனிதன்" என்ற குறிப்புடன் ஒப்பிடுவதை சாத்தியமாக்குகிறது, கற்றல் செயல்பாட்டில் மட்டுமே இது தனிப்பட்ட சொற்றொடர்கள் மற்றும் சொல் சேர்க்கைகளுடன் அல்ல, ஆனால் முழு வாக்கியங்களுடனும் செயல்படுகிறது. முக்கிய பிரச்சனை என்னவென்றால், அத்தகைய அமைப்பைப் பயிற்றுவிப்பதற்கு கணிசமாக அதிக கணினி சக்தி தேவைப்படுகிறது.

செயல்முறையை விரைவுபடுத்த, டெவலப்பர்கள் NVIDIA இலிருந்து GPUகளைப் பயன்படுத்துகின்றனர், அத்துடன் Google இன் டென்சர் ப்ராசசிங் யூனிட் (TPU), தனியுரிம சில்லுகள், குறிப்பாக இயந்திர கற்றல் தொழில்நுட்பங்களுக்குத் தழுவி. கிராபிக்ஸ் சில்லுகள் ஆரம்பத்தில் மேட்ரிக்ஸ் கணக்கீட்டு அல்காரிதம்களுக்கு உகந்ததாக இருக்கும், எனவே செயல்திறன் ஆதாயம் CPU உடன் ஒப்பிடும்போது 7-15 மடங்கு ஆகும்.

அப்படியிருந்தும், ஒரு நரம்பியல் மாதிரியைப் பயிற்றுவிப்பதற்கு 1 முதல் 3 வாரங்கள் ஆகும், அதே சமயம் அதே அளவுள்ள புள்ளிவிவர மாதிரியானது பயிற்சி பெற 1 முதல் 3 நாட்கள் ஆகும், மேலும் அளவு அதிகரிக்கும் போது இந்த வேறுபாடு அதிகரிக்கிறது.

இருப்பினும், இயந்திர மொழிபெயர்ப்பு பணியின் பின்னணியில் நரம்பியல் நெட்வொர்க்குகளின் வளர்ச்சியைத் தடுக்கும் தொழில்நுட்ப சிக்கல்கள் மட்டுமல்ல. இறுதியில், மொழி மாதிரிகளை முன்னதாகவே பயிற்றுவிக்க முடிந்தது, மெதுவாக இருந்தாலும், அடிப்படை தடைகள் எதுவும் இல்லை.

நரம்பியல் நெட்வொர்க்குகளுக்கான ஃபேஷன் ஒரு பாத்திரத்தை வகித்தது. பலர் உள்நாட்டில் வளர்ந்து வருகின்றனர், ஆனால் அவர்கள் அதை அறிவிக்க அவசரப்படவில்லை, ஒருவேளை, நரம்பியல் நெட்வொர்க்குகள் என்ற சொற்றொடரிலிருந்து சமூகம் எதிர்பார்க்கும் தரத்தின் அதிகரிப்பு அவர்கள் பெறமாட்டார்கள் என்று பயந்து. பல நரம்பியல் மொழிபெயர்ப்பாளர்கள் ஒன்றன் பின் ஒன்றாக அறிவிக்கப்பட்டனர் என்ற உண்மையை இது விளக்கலாம்.

மொழிபெயர்ப்பு தரம்: யாருடைய BLEU ஸ்கோர் தடிமனாக உள்ளது?

மொழிபெயர்ப்பு தரத்தில் அதிகரிப்பு, திரட்டப்பட்ட எதிர்பார்ப்புகள் மற்றும் மொழிபெயர்ப்புக்கான நரம்பியல் நெட்வொர்க்குகளின் வளர்ச்சி மற்றும் ஆதரவுடன் செலவினங்களின் அதிகரிப்பு ஆகியவற்றுடன் ஒத்துப்போகிறதா என்பதைப் புரிந்துகொள்ள முயற்சிப்போம்.
கிளாசிக்கல் புள்ளியியல் அணுகுமுறையுடன் (அல்லது சொற்றொடர் அடிப்படையிலான இயந்திர மொழிபெயர்ப்பு, பிபிஎம்டி என்றும் அழைக்கப்படுகிறது) ஒப்பிடும்போது, ​​மொழி ஜோடியைப் பொறுத்து, நரம்பியல் இயந்திர மொழிபெயர்ப்பு 58% முதல் 87% வரை ஒப்பீட்டு மேம்பாட்டை அளிக்கிறது என்பதை Google தனது ஆராய்ச்சியில் நிரூபிக்கிறது.


SYSTRAN ஒரு ஆய்வை நடத்துகிறது, இதில் மொழிபெயர்ப்பின் தரம் பல்வேறு அமைப்புகள் மற்றும் "மனித" மொழிபெயர்ப்பால் செய்யப்பட்ட பல வழங்கப்பட்ட விருப்பங்களிலிருந்து தேர்ந்தெடுப்பதன் மூலம் மதிப்பிடப்படுகிறது. மேலும் மனித மொழிபெயர்ப்பை விட 46% வழக்குகளில் அவரது நரம்பியல் மொழியாக்கம் விரும்பப்படுவதாக அவர் கூறுகிறார்.

மொழிபெயர்ப்பு தரம்: திருப்புமுனை உண்டா?

கூகிள் 60% அல்லது அதற்கும் அதிகமான முன்னேற்றம் இருப்பதாகக் கூறினாலும், இந்த எண்ணிக்கையில் ஒரு சிறிய கேட்ச் உள்ளது. நிறுவனத்தின் பிரதிநிதிகள் "உறவினர் மேம்பாடு" பற்றி பேசுகிறார்கள், அதாவது, உன்னதமான புள்ளிவிவர மொழிபெயர்ப்பாளருடன் தொடர்புடைய மனித மொழிபெயர்ப்பின் தரத்திற்கான நரம்பியல் அணுகுமுறையுடன் அவர்கள் எவ்வளவு நெருக்கமாக நிர்வகிக்கிறார்கள்.


"Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation" என்ற கட்டுரையில் கூகுள் வழங்கிய முடிவுகளை ஆய்வு செய்யும் தொழில்துறை வல்லுநர்கள், வழங்கப்பட்ட முடிவுகளைப் பற்றி மிகவும் சந்தேகம் கொண்டுள்ளனர் மற்றும் உண்மையில் BLEU மதிப்பெண் 10% மட்டுமே மேம்படுத்தப்பட்டுள்ளது என்றும், மேலும் விக்கிபீடியாவிலிருந்து மிகவும் எளிமையான சோதனைகளில் குறிப்பிடத்தக்க முன்னேற்றம் துல்லியமாக கவனிக்கப்படுகிறது, இது பெரும்பாலும் பிணையத்தைப் பயிற்றுவிக்கும் செயல்பாட்டில் பயன்படுத்தப்பட்டது.

PROMT இன் உள்ளே, எங்கள் கணினியின் பல்வேறு உரைகளில் உள்ள மொழிபெயர்ப்புகளை போட்டியாளர்களுடன் நாங்கள் தொடர்ந்து ஒப்பிட்டுப் பார்க்கிறோம், எனவே உற்பத்தியாளர்கள் கூறுவது போல் நரம்பியல் மொழிபெயர்ப்பு உண்மையில் முந்தைய தலைமுறையை விட உயர்ந்ததா என்பதைச் சரிபார்க்கும் எடுத்துக்காட்டுகள் எங்களிடம் உள்ளன.

அசல் உரை (EN): கவலை யாருக்கும் எந்த நன்மையும் செய்யவில்லை.
Google Translation PBMT: கவலைப்படாமல் யாருக்கும் எந்த நன்மையையும் செய்யவில்லை.
கூகுள் மொழிபெயர்ப்பு NMT: கவலை யாருக்கும் உதவவில்லை.

மூலம், Translate.Ru இல் அதே சொற்றொடரின் மொழிபெயர்ப்பு: "கவலை யாருக்கும் எந்த நன்மையையும் கொண்டு வரவில்லை," நரம்பியல் நெட்வொர்க்குகளைப் பயன்படுத்தாமல் அது இருந்ததையும் அப்படியே இருப்பதையும் நீங்கள் பார்க்கலாம்.

மைக்ரோசாஃப்ட் மொழிபெயர்ப்பாளர் இந்த விஷயத்தில் மிகவும் பின்தங்கியிருக்கவில்லை. கூகுளின் சக ஊழியர்களைப் போலல்லாமல், அவர்கள் ஒரு வலைத்தளத்தை உருவாக்கியுள்ளனர், அங்கு நீங்கள் இரண்டு முடிவுகளை மொழிபெயர்க்கலாம் மற்றும் ஒப்பிடலாம்: நரம்பியல் மற்றும் முன் நரம்பியல், தரத்தில் வளர்ச்சி பற்றிய அறிக்கைகள் ஆதாரமற்றவை அல்ல என்பதை உறுதிசெய்ய.


இந்த எடுத்துக்காட்டில், முன்னேற்றம் இருப்பதைக் காண்கிறோம், அது உண்மையில் கவனிக்கத்தக்கது. முதல் பார்வையில், இயந்திர மொழிபெயர்ப்பு மனித மொழிபெயர்ப்புடன் ஏறக்குறைய பிடித்துவிட்டது என்ற டெவலப்பர்களின் கூற்று உண்மையாகத் தெரிகிறது. ஆனால் இது உண்மையில் அப்படியா, வணிகத்திற்கான தொழில்நுட்பத்தின் நடைமுறை பயன்பாட்டின் அடிப்படையில் இது என்ன அர்த்தம்?

பொதுவாக, நரம்பியல் வலைப்பின்னல்களைப் பயன்படுத்தி மொழிபெயர்ப்பது புள்ளிவிவர மொழிபெயர்ப்பை விட சிறந்தது, மேலும் இந்த தொழில்நுட்பம் வளர்ச்சிக்கான மகத்தான ஆற்றலைக் கொண்டுள்ளது. ஆனால் சிக்கலை நாம் கவனமாகப் பார்த்தால், எல்லாவற்றிலும் முன்னேற்றம் இல்லை என்பதையும், பணியைப் பொருட்படுத்தாமல் எல்லா பணிகளையும் நரம்பியல் நெட்வொர்க்குகளுக்குப் பயன்படுத்த முடியாது என்பதையும் நாம் காணலாம்.

இயந்திர மொழிபெயர்ப்பு: சவால்கள் என்ன?

தானியங்கி மொழிபெயர்ப்பாளரிடமிருந்து அதன் இருப்பின் முழு வரலாறும் - இது ஏற்கனவே 60 ஆண்டுகளுக்கும் மேலாகும்! - அவர்கள் ஒருவித மாயாஜாலத்தை எதிர்பார்த்தனர், அறிவியல் புனைகதை படங்களில் இருந்து ஒரு இயந்திரமாக கற்பனை செய்து, எந்த பேச்சையும் உடனடியாக வேற்றுகிரகவாசிகளின் விசில் மற்றும் பின்புறமாக மாற்றுகிறார்கள்.

உண்மையில், பணிகள் வெவ்வேறு நிலைகளில் வருகின்றன, அவற்றில் ஒன்று "உலகளாவிய" அல்லது பேசுவதற்கு, அன்றாட பணிகளுக்கான "அன்றாட" மொழிபெயர்ப்பையும் புரிந்துகொள்வதையும் எளிதாக்குகிறது. ஆன்லைன் மொழிபெயர்ப்பு சேவைகள் மற்றும் பல மொபைல் தயாரிப்புகள் இந்த மட்டத்தில் பணிகளைச் சிறப்பாகச் சமாளிக்கின்றன.

அத்தகைய பணிகள் அடங்கும்:

பல்வேறு நோக்கங்களுக்காக சொற்கள் மற்றும் குறுகிய நூல்களின் விரைவான மொழிபெயர்ப்பு;
மன்றங்கள், சமூக வலைப்பின்னல்கள், உடனடி தூதர்கள் ஆகியவற்றில் தொடர்பு கொள்ளும்போது தானியங்கி மொழிபெயர்ப்பு;
செய்திகள், விக்கிபீடியா கட்டுரைகளைப் படிக்கும்போது தானியங்கி மொழிபெயர்ப்பு;
பயண மொழிபெயர்ப்பாளர் (மொபைல்).

நரம்பியல் நெட்வொர்க்குகளைப் பயன்படுத்தி மொழிபெயர்ப்பின் தரத்தை அதிகரிப்பதற்கான எடுத்துக்காட்டுகள் அனைத்தும் இந்த பணிகளுடன் தொடர்புடையவை.

இருப்பினும், இயந்திர மொழிபெயர்ப்பு தொடர்பான வணிக இலக்குகள் மற்றும் நோக்கங்கள் என்று வரும்போது, ​​விஷயங்கள் கொஞ்சம் வித்தியாசமாக இருக்கும். எடுத்துக்காட்டாக, கார்ப்பரேட் இயந்திர மொழிபெயர்ப்பு அமைப்புகளுக்கான சில தேவைகள் இங்கே:

வாடிக்கையாளர்கள், கூட்டாளர்கள், முதலீட்டாளர்கள், வெளிநாட்டு ஊழியர்களுடன் வணிக கடிதத்தின் மொழிபெயர்ப்பு;
வலைத்தளங்கள், ஆன்லைன் கடைகள், தயாரிப்பு விளக்கங்கள், வழிமுறைகளின் உள்ளூர்மயமாக்கல்;
பயனர் உள்ளடக்கத்தின் மொழிபெயர்ப்பு (விமர்சனங்கள், மன்றங்கள், வலைப்பதிவுகள்);
வணிக செயல்முறைகள் மற்றும் மென்பொருள் தயாரிப்புகள் மற்றும் சேவைகளில் மொழிபெயர்ப்பை ஒருங்கிணைக்கும் திறன்;
சொற்களஞ்சியம், இரகசியத்தன்மை மற்றும் பாதுகாப்பு ஆகியவற்றுடன் இணக்கமாக மொழிபெயர்ப்பின் துல்லியம்.

நரம்பியல் நெட்வொர்க்குகளைப் பயன்படுத்தி ஏதேனும் மொழிபெயர்ப்பு வணிகச் சிக்கல்களைத் தீர்க்க முடியுமா மற்றும் எப்படி சரியாகத் தீர்க்க முடியும் என்பதை எடுத்துக்காட்டுகளைப் பயன்படுத்தி, புரிந்துகொள்ள முயற்சிப்போம்.

வழக்கு: அமேடியஸ்

அமேடியஸ் உலகின் மிகப்பெரிய உலகளாவிய விமான டிக்கெட் விநியோக அமைப்புகளில் ஒன்றாகும். ஒருபுறம், ஏர் கேரியர்கள் அதனுடன் இணைக்கப்பட்டுள்ளன, மறுபுறம், மாற்றங்கள் குறித்த அனைத்து தகவல்களையும் உண்மையான நேரத்தில் பெற்று தங்கள் வாடிக்கையாளர்களுக்கு தெரிவிக்க வேண்டிய ஏஜென்சிகள்.

வெவ்வேறு மூலங்களிலிருந்து முன்பதிவு அமைப்பில் தானாக உருவாக்கப்படும் கட்டணங்களை (கட்டண விதிகள்) பயன்படுத்துவதற்கான நிபந்தனைகளை உள்ளூர்மயமாக்குவதே பணி. இந்த விதிகள் எப்போதும் ஆங்கிலத்தில் எழுதப்படுகின்றன. கையேடு மொழிபெயர்ப்பு இங்கே நடைமுறையில் சாத்தியமற்றது, நிறைய தகவல்கள் இருப்பதால், அது அடிக்கடி மாறுகிறது. ஒரு விமான டிக்கெட் முகவர் தங்கள் வாடிக்கையாளர்களுக்கு உடனடியாகவும் திறமையாகவும் ஆலோசனை வழங்குவதற்காக ரஷ்ய மொழியில் கட்டண விதிகளைப் படிக்க விரும்புகிறார்.

வழக்கமான விதிமுறைகள் மற்றும் சுருக்கங்களை கணக்கில் எடுத்துக்கொண்டு, கட்டண விதிகளின் அர்த்தத்தை வெளிப்படுத்தும் தெளிவான மொழிபெயர்ப்பு தேவைப்படுகிறது. அமேடியஸ் முன்பதிவு அமைப்பில் நேரடியாக ஒருங்கிணைக்கப்படுவதற்கு தானியங்கி மொழிபெயர்ப்பு தேவைப்படுகிறது.

→ திட்டத்தின் பணி மற்றும் செயல்படுத்தல் ஆவணத்தில் விரிவாக விவரிக்கப்பட்டுள்ளது.

அமேடியஸ் ஃபேர் ரூல்ஸ் டிரான்ஸ்லேட்டரில் ஒருங்கிணைக்கப்பட்ட, PROMT Cloud API மூலம் செய்யப்பட்ட மொழிபெயர்ப்பையும், Google வழங்கும் “நரம்பியல்” மொழிபெயர்ப்பையும் ஒப்பிட முயற்சிப்போம்.

அசல்: சுற்றுப் பயணம் உடனடி கொள்முதல் கட்டணங்கள்

ப்ரோம்ட் (பகுப்பாய்வு அணுகுமுறை): ஒரு சுற்று விமானத்தின் உடனடி கொள்முதல் விலைகள்

ஜிஎன்எம்டி: சுற்று கொள்முதல்

நரம்பியல் மொழிபெயர்ப்பாளர் இங்கே சமாளிக்க முடியாது என்பது வெளிப்படையானது, மேலும் சிறிது தூரம் ஏன் என்பது தெளிவாகிவிடும்.

வழக்கு: டிரிப் அட்வைசர்

டிரிப் அட்வைசர் உலகின் மிகப்பெரிய பயணச் சேவைகளில் ஒன்றாகும், இது எந்த அறிமுகமும் தேவையில்லை. தி டெலிகிராப் வெளியிட்ட ஒரு கட்டுரையின் படி, ஒவ்வொரு நாளும் வெவ்வேறு மொழிகளில் பல்வேறு சுற்றுலா தளங்களின் 165,600 புதிய மதிப்புரைகள் தளத்தில் தோன்றும்.

இந்த மதிப்பாய்வின் அர்த்தத்தைப் புரிந்துகொள்ள போதுமான மொழிபெயர்ப்பு தரத்துடன் சுற்றுலா மதிப்புரைகளை ஆங்கிலத்திலிருந்து ரஷ்ய மொழியில் மொழிபெயர்ப்பதே பணி. முக்கிய சிரமம்: பயனர் உருவாக்கிய உள்ளடக்கத்தின் பொதுவான அம்சங்கள் (பிழைகள், எழுத்துப்பிழைகள், விடுபட்ட சொற்கள் கொண்ட உரைகள்).

டிரிப் அட்வைசர் இணையதளத்தில் வெளியிடுவதற்கு முன், மொழிபெயர்ப்பின் தரத்தை தானாக மதிப்பிடுவதும் பணியின் ஒரு பகுதியாகும். மொழிபெயர்க்கப்பட்ட அனைத்து உள்ளடக்கத்தையும் கைமுறையாக மதிப்பிடுவது சாத்தியமில்லை என்பதால், உயர்தர மொழியாக்கம் செய்யப்பட்ட மதிப்புரைகளை மட்டுமே TripAdvisor வெளியிடுவதை உறுதிசெய்ய, இயந்திர மொழிபெயர்ப்பு தீர்வு தன்னியக்க நம்பிக்கை மதிப்பெண்ணை வழங்க வேண்டும்.

தீர்வுக்காக, PROMT DeepHybrid தொழில்நுட்பம் பயன்படுத்தப்பட்டது, இது மொழிபெயர்ப்பு முடிவுகளின் புள்ளிவிவர பிந்தைய எடிட்டிங் உட்பட இறுதி வாசகருக்கு புரிந்துகொள்ளக்கூடிய உயர் தரமான மொழிபெயர்ப்பைப் பெறுவதை சாத்தியமாக்குகிறது.

எடுத்துக்காட்டுகளைப் பார்ப்போம்:

அசல்: நாங்கள் நேற்றிரவு அங்கு ஆர்வத்துடன் சாப்பிட்டோம், அது ஒரு அருமையான உணவு. சேவை அதிக தாங்காமல் கவனத்துடன் இருந்தது.

ப்ரோம்ட் (கலப்பின மொழிபெயர்ப்பு): நாங்கள் நேற்றிரவு அங்கு ஆர்வத்துடன் சாப்பிட்டோம், அது அருமையான உணவு. பணியாட்கள் பொறுக்காமல் கவனத்துடன் இருந்தனர்.

GNMT: நாங்கள் நேற்று இரவு அங்கு ஒரு ஆர்வத்துடன் சாப்பிட்டோம், அது ஒரு அற்புதமான உணவு. சேவையை மிகைப்படுத்தாமல் கவனத்துடன் இருந்தது.

இங்கே எல்லாம் முந்தைய உதாரணத்தைப் போல தரத்தின் அடிப்படையில் மனச்சோர்வடையவில்லை. பொதுவாக, அதன் அளவுருக்களின் அடிப்படையில், இந்த சிக்கலை நரம்பியல் நெட்வொர்க்குகளைப் பயன்படுத்தி தீர்க்க முடியும், மேலும் இது மொழிபெயர்ப்பின் தரத்தை மேலும் மேம்படுத்தலாம்.

வணிகத்திற்காக NMT ஐப் பயன்படுத்துவதில் உள்ள சவால்கள்

முன்னர் குறிப்பிட்டபடி, "உலகளாவிய" மொழிபெயர்ப்பாளர் எப்போதும் ஏற்றுக்கொள்ளக்கூடிய தரத்தை வழங்குவதில்லை மற்றும் குறிப்பிட்ட சொற்களை ஆதரிக்க முடியாது. நரம்பியல் நெட்வொர்க்குகளை உங்கள் செயல்முறைகளில் மொழிபெயர்ப்பதற்கு ஒருங்கிணைத்து பயன்படுத்த, நீங்கள் அடிப்படைத் தேவைகளைப் பூர்த்தி செய்ய வேண்டும்:

ஒரு நரம்பியல் வலையமைப்பைப் பயிற்றுவிப்பதற்கு போதுமான அளவு இணையான நூல்கள் இருப்பது. பெரும்பாலும் வாடிக்கையாளரிடம் அவற்றில் சில உள்ளன அல்லது இந்த தலைப்பில் எந்த உரைகளும் இயற்கையில் இல்லை. அவை வகைப்படுத்தப்படலாம் அல்லது தானியங்கு செயலாக்கத்திற்கு மிகவும் பொருத்தமானதாக இல்லாத நிலையில் இருக்கலாம்.

ஒரு மாதிரியை உருவாக்க, உங்களுக்கு குறைந்தபட்சம் 100 மில்லியன் டோக்கன்கள் (சொல் பயன்பாடுகள்) உள்ள தரவுத்தளம் தேவை, மேலும் அதிகமாகவோ அல்லது குறைவாகவோ ஏற்றுக்கொள்ளக்கூடிய தரத்தின் மொழிபெயர்ப்பைப் பெற - 500 மில்லியன் டோக்கன்கள். ஒவ்வொரு நிறுவனத்திற்கும் அத்தகைய அளவு பொருட்கள் இல்லை.

பெறப்பட்ட முடிவின் தரத்தை தானாக மதிப்பிடுவதற்கான ஒரு பொறிமுறை அல்லது அல்காரிதம்களின் கிடைக்கும் தன்மை.

போதுமான கணினி ஆற்றல்.
"உலகளாவிய" நரம்பியல் மொழிபெயர்ப்பாளர் பெரும்பாலும் தரத்தில் பொருத்தமானவர் அல்ல, மேலும் ஏற்றுக்கொள்ளக்கூடிய தரம் மற்றும் வேலையின் வேகத்தை வழங்கும் திறன் கொண்ட உங்கள் சொந்த நரம்பியல் நெட்வொர்க்கை வரிசைப்படுத்த, ஒரு "சிறிய மேகம்" தேவை.

தனியுரிமையை என்ன செய்வது என்பது தெளிவாகத் தெரியவில்லை.
பாதுகாப்பு காரணங்களுக்காக ஒவ்வொரு வாடிக்கையாளரும் தங்கள் உள்ளடக்கத்தை மேகக்கணிக்கு மொழிபெயர்ப்பதற்குத் தயாராக இல்லை, மேலும் NMT என்பது கிளவுட் முதல் கதையாகும்.

முடிவுரை

பொதுவாக, நரம்பியல் தானியங்கி மொழிபெயர்ப்பு "முழுமையான" புள்ளியியல் அணுகுமுறையை விட உயர் தரமான முடிவுகளை உருவாக்குகிறது;
"உலகளாவிய மொழிபெயர்ப்பின்" சிக்கலைத் தீர்ப்பதற்கு நரம்பியல் நெட்வொர்க் மூலம் தானியங்கி மொழிபெயர்ப்பு மிகவும் பொருத்தமானது;
எம்டிக்கான அணுகுமுறைகள் எதுவும் எந்த மொழிபெயர்ப்புச் சிக்கலையும் தீர்ப்பதற்கான சிறந்த உலகளாவிய கருவியாக இல்லை;
வணிக மொழிபெயர்ப்பு சிக்கல்களைத் தீர்க்க, சிறப்புத் தீர்வுகள் மட்டுமே அனைத்துத் தேவைகளுக்கும் இணங்க உத்தரவாதம் அளிக்கும்.

உங்கள் மொழிபெயர்ப்பு பணிகளுக்கு, இதற்கு மிகவும் பொருத்தமான மொழிபெயர்ப்பாளரை நீங்கள் பயன்படுத்த வேண்டும் என்ற முற்றிலும் வெளிப்படையான மற்றும் தர்க்கரீதியான முடிவுக்கு நாங்கள் வருகிறோம். உள்ளே நியூரல் நெட்வொர்க் இருக்கிறதா இல்லையா என்பது முக்கியமல்ல. பணியைப் புரிந்துகொள்வது மிகவும் முக்கியமானது.

குறிச்சொற்கள்: குறிச்சொற்களைச் சேர்க்கவும்

Yandex.Translator சேவையானது நூல்களை மொழிபெயர்க்கும் போது நரம்பியல் நெட்வொர்க் தொழில்நுட்பங்களைப் பயன்படுத்தத் தொடங்கியது, இது மொழிபெயர்ப்பின் தரத்தை மேம்படுத்துவதை சாத்தியமாக்குகிறது என்று Yandex இணையதளம் தெரிவித்துள்ளது.

புக்மார்க்குகளுக்கு

இந்தச் சேவை ஒரு கலப்பின அமைப்பில் இயங்குகிறது, யாண்டெக்ஸ் விளக்கினார்: நரம்பியல் வலையமைப்பைப் பயன்படுத்தி மொழிபெயர்ப்பு தொழில்நுட்பம் தொடங்கப்பட்டதிலிருந்து மொழிபெயர்ப்பாளரில் இயங்கும் புள்ளிவிவர மாதிரியில் சேர்க்கப்பட்டது.

"ஒரு புள்ளியியல் மொழிபெயர்ப்பாளரைப் போலல்லாமல், ஒரு நரம்பியல் நெட்வொர்க் உரைகளை தனிப்பட்ட வார்த்தைகளாகவும் சொற்றொடர்களாகவும் உடைக்காது. இது முழு முன்மொழிவையும் உள்ளீடாகப் பெறுகிறது மற்றும் அதன் மொழிபெயர்ப்பை வெளியிடுகிறது," என்று ஒரு நிறுவனத்தின் பிரதிநிதி விளக்கினார். அவரைப் பொறுத்தவரை, இந்த அணுகுமுறை சூழலை கணக்கில் எடுத்துக்கொள்ளவும், மொழிபெயர்க்கப்பட்ட உரையின் அர்த்தத்தை சிறப்பாக வெளிப்படுத்தவும் அனுமதிக்கிறது.

புள்ளிவிவர மாதிரி, இதையொட்டி, அரிய சொற்கள் மற்றும் சொற்றொடர்களை சிறப்பாகச் சமாளிக்கிறது, Yandex வலியுறுத்தியது. "ஒரு வாக்கியத்தின் பொருள் தெளிவாக இல்லை என்றால், அது ஒரு நரம்பியல் நெட்வொர்க் செய்யக்கூடியது போல் கற்பனை செய்யாது" என்று நிறுவனம் குறிப்பிட்டது.

மொழிபெயர்க்கும் போது, ​​சேவை இரண்டு மாதிரிகளையும் பயன்படுத்துகிறது, பின்னர் ஒரு இயந்திர கற்றல் அல்காரிதம் முடிவுகளை ஒப்பிட்டு, அதன் கருத்துப்படி, சிறந்த விருப்பத்தை வழங்குகிறது. "ஒவ்வொரு முறையிலிருந்தும் சிறந்ததை எடுத்து மொழிபெயர்ப்பின் தரத்தை மேம்படுத்த கலப்பின அமைப்பு உங்களை அனுமதிக்கிறது," என்கிறார் யாண்டெக்ஸ்.

செப்டம்பர் 14 அன்று, மொழிபெயர்ப்பாளரின் இணையப் பதிப்பில் ஒரு சுவிட்ச் தோன்றும், அதனுடன் நீங்கள் கலப்பின மற்றும் புள்ளிவிவர மாதிரிகள் மூலம் செய்யப்படும் மொழிபெயர்ப்புகளை ஒப்பிடலாம். அதே நேரத்தில், சில நேரங்களில் சேவை நூல்களை மாற்றாமல் போகலாம், நிறுவனம் குறிப்பிட்டது: "இதன் பொருள் என்னவென்றால், கலப்பின மாதிரியானது புள்ளிவிவர மொழிபெயர்ப்பு சிறந்தது என்று முடிவு செய்தது."

மணி

இந்தச் செய்தியை உங்களுக்கு முன்பே படித்தவர்களும் இருக்கிறார்கள்.
புதிய கட்டுரைகளைப் பெற குழுசேரவும்.
மின்னஞ்சல்
பெயர்
குடும்ப பெயர்
நீங்கள் எப்படி தி பெல் வாசிக்க விரும்புகிறீர்கள்?
ஸ்பேம் இல்லை