Unicode எழுத்துரு ஆய்வி
Unicode எழுத்துக்கள் மற்றும் குறியீடுகளை தேடவும், ஆராயவும், நகலெடுக்கவும்
Unicode எழுத்துரு ஆய்வி பற்றி
இந்த இலவச Unicode எழுத்துரு ஆய்வி, Unicode எழுத்துக்கள், குறியீடுகள், emojis மற்றும் சிறப்பு எழுத்துருக்களை தேட, உலாவ மற்றும் நகலெடுக்க உதவுகிறது. Unicode தரநிலையில் 140,000க்கும் மேற்பட்ட எழுத்துக்கள் உள்ளன, சரியான குறியீட்டைக் கண்டுபிடிப்பது சவாலானது - இந்த கருவி அதை எளிதாக்குகிறது.
எழுத்து பெயர் மூலம் தேடவும், விவரங்களைக் காண ஒரு எழுத்தை ஒட்டவும் அல்லது Unicode குறியீட்டு புள்ளிகளை (U+2192 அல்லது → போன்றவை) உள்ளிடவும். தொடர்புடைய எழுத்துக்களைக் கண்டறிய Unicode தொகுதிகள் மூலம் உலாவவும். உடனடி முடிவுகளுக்காக அனைத்து செயலாக்கங்களும் உங்கள் உலாவியில் உள்ளூரில் செய்யப்படுகின்றன.
டெவலப்பர்கள், டிசைனர்கள், எழுத்தாளர்கள் மற்றும் Unicode எழுத்துக்களுக்கு விரைவான அணுகல் தேவைப்படும் அனைவருக்கும் ஏற்றது.
எவ்வாறு பயன்படுத்துவது
- பெயர் மூலம் தேடவும்: எழுத்துக்களைக் கண்டறிய "arrow", "heart" அல்லது "copyright" போன்ற முக்கிய சொற்களை உள்ளிடவும்
- எழுத்து மூலம் தேடவும்: அதன் Unicode தகவலைக் காண எந்த எழுத்தையும் (→, ©, அல்லது 🎉 போன்றவை) ஒட்டவும்
- குறியீடு மூலம் தேடவும்: Unicode குறியீட்டு புள்ளிகளை பின்வரும் வடிவங்களில் உள்ளிடவும்:
- U+2192 (Unicode குறியீடு)
- → (HTML தசம entity)
- → (HTML பதின்மம் entity)
- 0x2192 (பதின்மம்)
- 8594 (தசம எண்)
- தொகுதி மூலம் உலாவவும்: அந்த வரம்பில் உள்ள அனைத்து எழுத்துக்களையும் காண கீழ்தோன்றும் பட்டியலில் இருந்து Unicode தொகுதியைத் தேர்ந்தெடுக்கவும்
- எழுத்துக்களை நகலெடுக்கவும்: எழுத்தை clipboard-க்கு நகலெடுக்க எந்த எழுத்து அட்டையையும் கிளிக் செய்யவும்
- விவரங்களைக் காணவும்: Unicode குறியீட்டு புள்ளி, HTML entities, தசம/பதின்மம் மதிப்புகள் மற்றும் எழுத்து பெயர்களைக் காணவும்
அம்சங்கள்
- விரிவான தேடல்: எழுத்து பெயர், குறியீட்டு புள்ளி அல்லது எழுத்தின் மூலம் தேடவும்
- பல வடிவங்கள்: U+, , , 0x மற்றும் தசம குறியீட்டு புள்ளி வடிவங்களை ஆதரிக்கிறது
- Unicode தொகுதிகள்: Unicode தொகுதிகளால் ஒழுங்கமைக்கப்பட்ட எழுத்துக்களை உலாவவும்
- எழுத்துரு விவரங்கள்: Unicode குறியீடு, HTML entities, தசம/பதின்மம் மதிப்புகள் மற்றும் பெயர்களைக் காணவும்
- ஒரே கிளிக்கில் நகல்: எழுத்துக்கள், குறியீட்டு புள்ளிகள் அல்லது HTML entities-ஐ உடனடியாக நகலெடுக்கவும்
- காட்சி முன்னோட்டம்: எளிதாக அடையாளம் காண பெரிய எழுத்து காட்சி
- வேகமான & ஆஃப்லைன்: சர்வர் கோரிக்கைகள் இல்லாமல் முழுவதுமாக உங்கள் உலாவியில் செயல்படுகிறது
- மொபைல் நட்பு: அனைத்து சாதனங்களிலும் செயல்படும் முழு பதிலளிக்கக்கூடிய வடிவமைப்பு
தனியுரிமை & பாதுகாப்பு
உங்கள் தனியுரிமை முக்கியம். இந்த கருவி அனைத்து தரவையும் முழுவதுமாக உங்கள் உலாவியில் செயலாக்குகிறது.
- எந்த சர்வருக்கும் தரவு அனுப்பப்படுவதில்லை
- உங்கள் தேடல்களின் பதிவு அல்லது கண்காணிப்பு இல்லை
- ஆரம்ப பக்க ஏற்றத்திற்குப் பிறகு முழுவதுமாக ஆஃப்லைனில் செயல்படுகிறது
- எந்த Unicode எழுத்தையும் ஆராய்வதற்கு பாதுகாப்பானது
பொதுவான பயன்பாடுகள்
- இணைய மேம்பாடு: சிறப்பு எழுத்துக்களுக்கான HTML entities மற்றும் Unicode குறியீடுகளைக் கண்டறியவும்
- உள்ளடக்க உருவாக்கம்: ஆவணங்களுக்கான குறியீடுகள், அம்புக்குறிகள் மற்றும் அலங்கார எழுத்துக்களைக் கண்டறியவும்
- சமூக ஊடகம்: இடுகைகள் மற்றும் சுயவிவரங்களுக்கான emojis மற்றும் சிறப்பு எழுத்துக்களைக் கண்டறியவும்
- வடிவமைப்பு வேலை: அச்சுக்கலை குறியீடுகள் மற்றும் சிறப்பு எழுத்துக்களை ஆராயவும்
- ஆவணமாக்கம்: தொழில்நுட்ப குறியீடுகள், கணித செயல்பாடுகள் மற்றும் குறியீடுகளைக் கண்டறியவும்
- பன்மொழி உள்ளடக்கம்: பல்வேறு எழுத்து முறைகளிலிருந்து எழுத்துக்களை அணுகவும்
- நிரலாக்கம்: சரம் கையாளுதலுக்கான Unicode குறியீட்டு புள்ளிகளைத் தேடவும்
- அணுகல்தன்மை: பொருத்தமான எழுத்துக்களைக் கண்டறிந்து அவற்றின் சரியான பெயர்களைக் கற்றுக்கொள்ளவும்
முக்கிய சொற்கள் & கருத்துக்கள்
Unicode
Unicode என்பது ஒரு உலகளாவிய எழுத்துரு குறியாக்க தரநிலை ஆகும், இது அனைத்து எழுத்து முறைகள் மற்றும் மொழிகளில் உள்ள ஒவ்வொரு எழுத்து, குறியீடு மற்றும் emoji-க்கும் தனிப்பயன் எண்ணை (குறியீட்டு புள்ளி) ஒதுக்குகிறது. இது வெவ்வேறு தளங்கள், சாதனங்கள் மற்றும் பயன்பாடுகள் முழுவதும் நிலையான உரை பிரதிநிதித்துவத்தை செயல்படுத்துகிறது.
குறியீட்டு புள்ளி (Code Point)
குறியீட்டு புள்ளி என்பது Unicode-ல் ஒவ்வொரு எழுத்துக்கும் ஒதுக்கப்பட்ட தனிப்பயன் எண் அடையாளங்காட்டி ஆகும், பொதுவாக U+XXXX என எழுதப்படுகிறது, இதில் XXXX ஒரு பதின்மம் எண். எடுத்துக்காட்டாக, U+0041 என்பது "A" எழுத்துக்கான குறியீட்டு புள்ளி, மற்றும் U+2192 என்பது வலது அம்புக்குறி "→" ஆகும்.
Unicode தொகுதி (Unicode Block)
Unicode தொகுதிகள் என்பது எழுத்துமுறை, நோக்கம் அல்லது தீம் மூலம் தொகுக்கப்பட்ட குறியீட்டு புள்ளிகளின் தொடர்ச்சியான வரம்புகள் ஆகும். எடுத்துக்காட்டுகளில் "Basic Latin" (U+0000–U+007F), "Greek and Coptic" (U+0370–U+03FF), மற்றும் "Arrows" (U+2190–U+21FF) அடங்கும். தொகுதிகள் Unicode எழுத்துரு இடத்தை ஒழுங்கமைக்க உதவுகின்றன.
HTML Entity
HTML entities என்பது HTML/XML ஆவணங்களில் Unicode எழுத்துக்களை குறிக்கும் உரை சரங்கள் ஆகும். அவை பெயரிடப்பட்டதாக (© க்கு © போன்றவை) அல்லது எண்ணாக (© க்கு © அல்லது © போன்றவை) இருக்கலாம். ஆவண குறியாக்கத்தைப் பொருட்படுத்தாமல் எழுத்துக்கள் சரியாக காட்டப்படுவதை அவை உறுதி செய்கின்றன.
UTF-8
UTF-8 என்பது இணையத்தில் பயன்படுத்தப்படும் மிகவும் பொதுவான Unicode குறியாக்க வடிவமாகும். இது ஒவ்வொரு Unicode குறியீட்டு புள்ளியையும் 1-4 பைட்டுகளின் வரிசையாக குறிக்கிறது. UTF-8 ஆனது ASCII உடன் பின்னோக்கி இணக்கமானது மற்றும் அனைத்து மொழிகளிலிருந்தும் எழுத்துக்களை திறமையாக குறியாக்கம் செய்கிறது.
எழுத்துரு வகை (Character Category)
Unicode ஒவ்வொரு எழுத்துக்கும் அதன் பொதுவான தன்மையை விவரிக்கும் ஒரு வகையை ஒதுக்குகிறது, எடுத்துக்காட்டாக எழுத்து (L), எண் (N), நிறுத்தற்குறி (P), குறியீடு (S), குறி (M), பிரிப்பான் (Z), அல்லது மற்றவை (C). வகைகள் நிரல்களுக்கு எழுத்துக்களை சரியாக அடையாளம் கண்டு செயலாக்க உதவுகின்றன.
BMP (Basic Multilingual Plane)
BMP என்பது Unicode-ன் முதல் 65,536 குறியீட்டு புள்ளிகள் (U+0000 முதல் U+FFFF வரை), பெரும்பாலான நவீன மொழிகளுக்கான எழுத்துக்கள் மற்றும் பல குறியீடுகளைக் கொண்டது. BMP-க்கு வெளியே உள்ள எழுத்துக்கள் துணை எழுத்துக்கள் என அழைக்கப்படுகின்றன மற்றும் சில அமைப்புகளில் சிறப்பு கையாளுதல் தேவைப்படுகிறது.
உதாரணங்கள்
உதாரணம் 1: அம்புக்குறி குறியீடுகளைக் கண்டறிதல்
தேடல்: "arrow"
முடிவுகள்: → (U+2192 வலது அம்பு), ← (U+2190 இடது அம்பு), ↑ (U+2191 மேல் அம்பு), ↓ (U+2193 கீழ் அம்பு)
இந்த அம்புக்குறிகளை ஆவணமாக்கம், UI வடிவமைப்பு அல்லது திசை குறிப்பான்கள் தேவைப்படும் எங்கும் பயன்படுத்தவும்.
உதாரணம் 2: ஒரு எழுத்தை தேடுதல்
தேடல்: © (காப்புரிமை குறியீட்டை ஒட்டவும்)
முடிவு விவரங்கள்:
- Unicode: U+00A9
- HTML Entity: © அல்லது © அல்லது ©
- தசம எண்: 169
- பெயர்: COPYRIGHT SIGN
உதாரணம் 3: கணித குறியீடுகளைக் கண்டறிதல்
உலாவவும்: "Mathematical Operators" தொகுதியைத் தேர்ந்தெடுக்கவும்
கண்டறியவும்: ∑ (கூட்டுத்தொகை), ∫ (தொகை), ≈ (தோராயமாக சமம்), ≠ (சமம் இல்லை), ∞ (முடிவிலி), √ (வர்க்க மூலம்)
ஆவணங்கள் அல்லது கல்வி பொருட்களில் கணித குறியீட்டுக்கு ஏற்றது.
உதாரணம் 4: குறியீட்டு புள்ளி வடிவங்கள்
இந்த அனைத்து வடிவங்களும் ஒரே எழுத்தைக் (→) குறிக்கின்றன:
- U+2192 (Unicode குறியீடு)
- → (HTML தசம எண்)
- → (HTML பதின்மம்)
- 0x2192 (நிரலாக்க பதின்மம்)
- 8594 (தசம எண்)
முக்கிய குறிப்புகள்
அடிக்கடி கேட்கப்படும் கேள்விகள்
Unicode என்றால் என்ன?
Unicode என்பது ஒரு உலகளாவிய எழுத்துரு குறியாக்க தரநிலை ஆகும், இது அனைத்து மொழிகள் மற்றும் எழுத்து முறைகளில் உள்ள ஒவ்வொரு எழுத்து, குறியீடு மற்றும் emoji-க்கும் தனிப்பயன் குறியீட்டு புள்ளிகளை ஒதுக்குகிறது. இது உலகளவில் வெவ்வேறு தளங்கள், சாதனங்கள் மற்றும் பயன்பாடுகள் முழுவதும் நிலையான உரை பிரதிநிதித்துவத்தை செயல்படுத்துகிறது.
நான் Unicode எழுத்தை எவ்வாறு தேடுவது?
நீங்கள் பல வழிகளில் தேடலாம்: விவரணை முக்கிய சொற்களை ("heart" அல்லது "arrow" போன்றவை) உள்ளிடவும், விவரங்களைக் காண எழுத்தையே ஒட்டவும், Unicode குறியீட்டு புள்ளிகளை (U+2192) உள்ளிடவும், HTML entities (→) உள்ளிடவும், அல்லது கீழ்தோன்றும் பட்டியலில் இருந்து Unicode தொகுதியைத் தேர்ந்தெடுத்து உலாவவும்.
Unicode குறியீட்டு புள்ளிகள் என்றால் என்ன?
குறியீட்டு புள்ளிகள் என்பது ஒவ்வொரு Unicode எழுத்துக்கும் தனிப்பயன் எண் அடையாளங்காட்டிகள் ஆகும், U+XXXX என எழுதப்படுகின்றன, இதில் XXXX ஒரு பதின்மம் எண். எடுத்துக்காட்டாக, U+0041 என்பது "A" மற்றும் U+2192 என்பது "→" ஆகும். 140,000+ Unicode எழுத்துக்கள் ஒவ்வொன்றும் அதன் சொந்த குறியீட்டு புள்ளியைக் கொண்டுள்ளன.
எனது HTML-ல் Unicode எழுத்துக்களை எவ்வாறு பயன்படுத்துவது?
எழுத்தை நேரடியாக நகலெடுக்கவும் அல்லது அதன் HTML entity-ஐ பயன்படுத்தவும். பொதுவான எழுத்துக்களுக்கு © போன்ற பெயரிடப்பட்ட entities செயல்படும். எந்த எழுத்துக்கும் © (தசம எண்) அல்லது © (பதின்மம்) போன்ற எண் entities செயல்படும். நேரடி எழுத்து பயன்பாட்டிற்கு உங்கள் HTML charset-ஐ UTF-8 ஆக அமைக்கவும்.
சில எழுத்துக்கள் பெட்டிகள் அல்லது கேள்விக்குறிகளாக ஏன் காட்டப்படுகின்றன?
பெட்டிகள் அல்லது கேள்விக்குறிகள் உங்கள் தற்போதைய எழுத்துரு அந்த எழுத்தை உள்ளடக்கவில்லை என்பதைக் குறிக்கின்றன. எழுத்து இன்னும் உள்ளது மற்றும் சரியாக நகலெடுக்கப்படும். அதிக Unicode எழுத்துக்களைக் காட்ட "Noto Sans" போன்ற விரிவான எழுத்துருக்களை நிறுவவும் அல்லது font-family fallbacks பயன்படுத்தவும்.
Unicode தொகுதிகளுக்கு இடையே என்ன வேறுபாடு?
Unicode தொகுதிகள் என்பது தொடர்புடைய எழுத்துக்களை தொகுக்கும் தொடர்ச்சியான வரம்புகள் ஆகும். "Basic Latin" ஆங்கில எழுத்துக்களைக் கொண்டுள்ளது, "Arrows" அம்பு குறியீடுகளைக் கொண்டுள்ளது, "CJK" சீன/ஜப்பானிய/கொரிய எழுத்துக்களைக் கொண்டுள்ளது, போன்றவை. தொகுதிகள் Unicode-ன் 140,000+ எழுத்துக்களை நிர்வகிக்கக்கூடிய வகைகளாக ஒழுங்கமைக்கின்றன.
எனது தேடல் தரவு எந்த சர்வருக்கும் அனுப்பப்படுகிறதா?
இல்லை, அனைத்து எழுத்துரு ஆய்வுகள் மற்றும் தேடல்கள் முழுவதுமாக உங்கள் உலாவியில் நடக்கின்றன. உங்கள் தேடல்கள் மற்றும் தரவு ஒருபோதும் உங்கள் சாதனத்தை விட்டு வெளியேறுவதில்லை, இது இந்த கருவியை முழுமையாக தனிப்பட்ட மற்றும் பாதுகாப்பானதாக ஆக்குகிறது.
நிரலாக்கத்தில் Unicode எழுத்துக்களை பயன்படுத்தலாமா?
ஆம், பெரும்பாலான நவீன நிரலாக்க மொழிகள் Unicode-ஐ ஆதரிக்கின்றன. குறியீட்டு புள்ளி குறியீட்டை (எ.கா., JavaScript-ல் \u2192, Python 3-ல் \u{2192}, அல்லது Perl-ல் \x{2192}) பயன்படுத்தவும் அல்லது UTF-8 குறியாக்கம் செய்யப்பட்ட மூல கோப்புகளில் எழுத்துக்களை நேரடியாக சேர்க்கவும். உங்கள் மொழியின் Unicode ஆவணமாக்கத்தைச் சரிபார்க்கவும்.
ஒருங்கிணைக்கும் எழுத்துக்கள் என்றால் என்ன?
ஒருங்கிணைக்கும் எழுத்துக்கள் என்பது முந்தைய எழுத்தை மாற்றும் சிறப்பு Unicode எழுத்துக்கள் ஆகும், உச்சரிப்பு குறிகள் அல்லது ஒலியெழுத்து குறிகள் போன்றவை. எடுத்துக்காட்டாக, "e" க்குப் பிறகு ஒருங்கிணைக்கும் கூர்மையான உச்சரிப்பு குறி (U+0301) "é" ஐ உருவாக்குகிறது. இவை தனியாக சரியாக காட்டப்படுவதில்லை ஆனால் அடிப்படை எழுத்துக்களுடன் ஒருங்கிணைகின்றன.
எனது விசைப்பலகையில் Unicode எழுத்துக்களை எவ்வாறு தட்டச்சு செய்வது?
முறைகள் அமைப்பைப் பொறுத்து மாறுபடும். Windows: Alt + எண் குறியீடு. Mac: Option + எழுத்து சேர்க்கைகள் அல்லது Character Viewer. Linux: Ctrl+Shift+U + பதின்மம் குறியீடு. அல்லது இந்த கருவியில் இருந்து நகலெடுத்து தேவையான இடத்தில் ஒட்டவும்.