Penjelajah Aksara Unicode

Cari, terokai, dan salin aksara dan simbol Unicode

Semua penerokaan aksara dilakukan secara setempat dalam pelayar anda.

Tentang Penjelajah Aksara Unicode

Penjelajah Aksara Unicode percuma ini membantu anda mencari, melayari, dan menyalin aksara Unicode, simbol, emoji, dan aksara khas. Dengan lebih 140,000 aksara dalam piawaian Unicode, mencari simbol yang tepat boleh menjadi mencabar - alat ini memudahkan prosesnya.

Cari mengikut nama aksara, tampal aksara untuk melihat butirannya, atau masukkan kod Unicode (seperti U+2192 atau →). Layari mengikut blok Unicode untuk menemui aksara yang berkaitan. Semua pemprosesan dilakukan secara setempat dalam pelayar anda untuk keputusan segera.

Sempurna untuk pembangun, pereka bentuk, penulis, dan sesiapa yang memerlukan akses pantas kepada aksara Unicode.

Cara Menggunakan

  1. Cari mengikut nama: Taip kata kunci seperti "arrow", "heart", atau "copyright" untuk mencari aksara
  2. Cari mengikut aksara: Tampal mana-mana aksara (seperti →, ©, atau 🎉) untuk melihat maklumat Unicode-nya
  3. Cari mengikut kod: Masukkan kod Unicode dalam format seperti:
    • U+2192 (notasi Unicode)
    • → (entiti perpuluhan HTML)
    • → (entiti heksadesimal HTML)
    • 0x2192 (heksadesimal)
    • 8594 (perpuluhan)
  4. Layari mengikut blok: Pilih blok Unicode daripada menu lungsur untuk melihat semua aksara dalam julat tersebut
  5. Salin aksara: Klik mana-mana kad aksara untuk menyalin aksara ke papan keratan
  6. Lihat butiran: Lihat kod Unicode, entiti HTML, nilai perpuluhan/heksadesimal, dan nama aksara

Ciri-ciri

  • Carian Menyeluruh: Cari mengikut nama aksara, kod, atau aksara itu sendiri
  • Pelbagai Format: Menyokong format kod U+, &#, &#x, 0x, dan perpuluhan
  • Blok Unicode: Layari aksara yang disusun mengikut blok Unicode
  • Butiran Aksara: Lihat kod Unicode, entiti HTML, nilai perpuluhan/heksadesimal, dan nama
  • Salin Satu Klik: Salin aksara, kod, atau entiti HTML dengan serta-merta
  • Pratonton Visual: Paparan aksara besar untuk pengenalan mudah
  • Pantas & Luar Talian: Berfungsi sepenuhnya dalam pelayar anda tanpa permintaan pelayan
  • Mesra Mudah Alih: Reka bentuk responsif berfungsi pada semua peranti

Privasi & Keselamatan

Privasi anda adalah penting. Alat ini memproses semua data sepenuhnya dalam pelayar anda.

  • Tiada data dihantar ke mana-mana pelayan
  • Tiada pencatatan atau penjejakan carian anda
  • Berfungsi sepenuhnya luar talian selepas muat halaman awal
  • Selamat untuk meneroka mana-mana aksara Unicode

Kegunaan Biasa

  • Pembangunan Web: Cari entiti HTML dan kod Unicode untuk aksara khas
  • Penciptaan Kandungan: Temui simbol, anak panah, dan aksara hiasan untuk dokumen
  • Media Sosial: Cari emoji dan aksara khas untuk kiriman dan profil
  • Kerja Reka Bentuk: Terokai simbol tipografi dan aksara khas
  • Dokumentasi: Cari simbol teknikal, operator matematik, dan notasi
  • Kandungan Berbilang Bahasa: Akses aksara daripada pelbagai sistem penulisan
  • Pengaturcaraan: Cari kod Unicode untuk pengendalian rentetan
  • Kebolehcapaian: Cari aksara yang sesuai dan pelajari nama yang betul

Istilah & Konsep Utama

Unicode

Unicode adalah piawaian pengekodan aksara universal yang memberikan nombor unik (kod) kepada setiap aksara, simbol, dan emoji merentasi semua sistem penulisan dan bahasa. Ia membolehkan perwakilan teks yang konsisten merentasi platform, peranti, dan aplikasi yang berbeza.

Code Point (Kod)

Code point adalah pengecam berangka unik yang diberikan kepada setiap aksara dalam Unicode, biasanya ditulis sebagai U+XXXX di mana XXXX adalah nombor heksadesimal. Contohnya, U+0041 adalah kod untuk huruf "A", dan U+2192 adalah anak panah kanan "→".

Unicode Block (Blok Unicode)

Blok Unicode adalah julat kod yang bersebelahan yang dikumpulkan mengikut skrip, tujuan, atau tema. Contohnya termasuk "Basic Latin" (U+0000–U+007F), "Greek and Coptic" (U+0370–U+03FF), dan "Arrows" (U+2190–U+21FF). Blok membantu menyusun ruang aksara Unicode.

HTML Entity (Entiti HTML)

Entiti HTML adalah rentetan teks yang mewakili aksara Unicode dalam dokumen HTML/XML. Ia boleh dinamakan (seperti © untuk ©) atau berangka (seperti © untuk © atau © untuk ©). Ia memastikan aksara dipaparkan dengan betul tanpa mengira pengekodan dokumen.

UTF-8

UTF-8 adalah format pengekodan Unicode yang paling biasa digunakan di web. Ia mewakili setiap kod Unicode sebagai urutan 1-4 bait. UTF-8 serasi ke belakang dengan ASCII dan mengekod aksara daripada semua bahasa dengan cekap.

Character Category (Kategori Aksara)

Unicode memberikan setiap aksara kepada kategori yang menerangkan sifat umumnya, seperti Letter (L - huruf), Number (N - nombor), Punctuation (P - tanda baca), Symbol (S - simbol), Mark (M - tanda), Separator (Z - pemisah), atau Other (C - lain-lain). Kategori membantu program mengenal pasti dan memproses aksara dengan betul.

BMP (Basic Multilingual Plane)

BMP adalah 65,536 kod pertama (U+0000 hingga U+FFFF) Unicode, mengandungi aksara untuk kebanyakan bahasa moden dan banyak simbol. Aksara di luar BMP dipanggil aksara tambahan dan memerlukan pengendalian khas dalam sesetengah sistem.

Contoh

Contoh 1: Mencari Simbol Anak Panah

Carian: "arrow"

Keputusan: → (U+2192 RIGHTWARDS ARROW), ← (U+2190 LEFTWARDS ARROW), ↑ (U+2191 UPWARDS ARROW), ↓ (U+2193 DOWNWARDS ARROW)

Gunakan anak panah ini dalam dokumentasi, reka bentuk UI, atau di mana-mana penunjuk arah diperlukan.

Contoh 2: Mencari Maklumat Aksara

Carian: © (tampal simbol hakcipta)

Butiran Keputusan:

  • Unicode: U+00A9
  • Entiti HTML: © atau © atau ©
  • Perpuluhan: 169
  • Nama: COPYRIGHT SIGN

Contoh 3: Mencari Simbol Matematik

Layari: Pilih blok "Mathematical Operators"

Temui: ∑ (penjumlahan), ∫ (pengamiran), ≈ (lebih kurang sama), ≠ (tidak sama), ∞ (infiniti), √ (punca kuasa dua)

Sempurna untuk notasi matematik dalam dokumen atau bahan pendidikan.

Contoh 4: Format Kod

Semua format ini merujuk kepada aksara yang sama (→):

  • U+2192 (notasi Unicode)
  • → (perpuluhan HTML)
  • → (heksadesimal HTML)
  • 0x2192 (heksadesimal pengaturcaraan)
  • 8594 (nombor perpuluhan)

Nota Penting

Sokongan Fon: Tidak semua fon mengandungi semua aksara Unicode. Jika anda melihat kotak segi empat sama (□) atau tanda soal (?), aksara itu wujud tetapi fon sistem anda tidak menyokongnya. Aksara masih boleh disalin dengan betul.
Keserasian Pelayar: Pelayar moden menyokong piawaian Unicode penuh. Pelayar atau sistem lama mungkin mempunyai sokongan terhad untuk aksara Unicode yang lebih baharu, terutamanya emoji dan aksara tambahan.
Teks Kanan-ke-Kiri: Sesetengah blok Unicode mengandungi skrip kanan-ke-kiri (Arab, Ibrani). Ini mungkin kelihatan terbalik atau menyebabkan masalah susun atur bergantung pada konteks. Gunakan atribut kearahan HTML yang sesuai apabila diperlukan.
Aksara Gabungan: Sesetengah aksara Unicode adalah tanda gabungan yang bertujuan untuk mengubah suai aksara lain (seperti aksen). Ini tidak akan dipaparkan dengan betul secara berasingan tetapi berfungsi apabila mengikut aksara asas.
Kawasan Penggunaan Peribadi: Unicode termasuk kawasan penggunaan peribadi untuk aksara tersuai. Ini tidak mempunyai rupa piawai dan akan dipaparkan secara berbeza pada sistem berbeza atau tidak langsung.
Variasi Emoji: Banyak emoji mempunyai berbilang kod bergantung pada warna kulit, jantina, atau gaya. Sesetengah emoji terdiri daripada berbilang kod yang digabungkan (seperti emoji keluarga).
Sensitiviti Kes: Unicode membezakan antara huruf besar dan huruf kecil sebagai aksara berasingan. "A" (U+0041) dan "a" (U+0061) adalah kod yang berbeza.

Soalan Lazim

Apakah Unicode?

Unicode adalah piawaian pengekodan aksara universal yang memberikan kod unik kepada setiap aksara, simbol, dan emoji merentasi semua bahasa dan sistem penulisan. Ia membolehkan perwakilan teks yang konsisten merentasi platform, peranti, dan aplikasi yang berbeza di seluruh dunia.

Bagaimana cara mencari aksara Unicode?

Anda boleh mencari dalam pelbagai cara: taip kata kunci deskriptif (seperti "heart" atau "arrow"), tampal aksara itu sendiri untuk melihat butirannya, masukkan kod Unicode (U+2192), entiti HTML (→), atau layari dengan memilih blok Unicode daripada menu lungsur.

Apakah code point Unicode?

Code point adalah pengecam berangka unik untuk setiap aksara Unicode, ditulis sebagai U+XXXX di mana XXXX adalah heksadesimal. Contohnya, U+0041 adalah "A" dan U+2192 adalah "→". Setiap daripada 140,000+ aksara Unicode mempunyai code point sendiri.

Bagaimana cara menggunakan aksara Unicode dalam HTML saya?

Salin aksara secara langsung atau gunakan entiti HTML-nya. Entiti dinamakan seperti © berfungsi untuk aksara biasa. Entiti berangka seperti © (perpuluhan) atau © (heksadesimal) berfungsi untuk mana-mana aksara. Tetapkan charset HTML anda kepada UTF-8 untuk penggunaan aksara langsung.

Mengapa sesetengah aksara ditunjukkan sebagai kotak atau tanda soal?

Kotak atau tanda soal menunjukkan fon semasa anda tidak mengandungi aksara tersebut. Aksara masih wujud dan akan disalin dengan betul. Pasang fon komprehensif seperti "Noto Sans" atau gunakan font-family fallback untuk memaparkan lebih banyak aksara Unicode.

Apakah perbezaan antara blok Unicode?

Blok Unicode adalah julat bersebelahan yang mengumpulkan aksara berkaitan. "Basic Latin" mengandungi huruf Inggeris, "Arrows" mengandungi simbol anak panah, "CJK" mengandungi aksara Cina/Jepun/Korea, dll. Blok menyusun 140,000+ aksara Unicode kepada kategori yang boleh diurus.

Adakah data carian saya dihantar ke mana-mana pelayan?

Tidak, semua penerokaan dan carian aksara berlaku sepenuhnya dalam pelayar anda. Carian dan data anda tidak meninggalkan peranti anda, menjadikan alat ini sepenuhnya peribadi dan selamat.

Bolehkah saya menggunakan aksara Unicode dalam pengaturcaraan?

Ya, kebanyakan bahasa pengaturcaraan moden menyokong Unicode. Gunakan notasi code point (cth: \u2192 dalam JavaScript, \u{2192} dalam Python 3, atau \x{2192} dalam Perl) atau sertakan aksara secara langsung dalam fail sumber yang dikodkan UTF-8. Semak dokumentasi Unicode bahasa anda.

Apakah aksara gabungan?

Aksara gabungan adalah aksara Unicode khas yang mengubah suai aksara sebelumnya, seperti aksen atau tanda diakritik. Contohnya, combining acute accent (U+0301) selepas "e" menghasilkan "é". Ia tidak dipaparkan dengan betul secara berasingan tetapi bergabung dengan aksara asas.

Bagaimana cara menaip aksara Unicode pada papan kekunci saya?

Kaedah berbeza mengikut sistem. Windows: Alt + kod angka. Mac: Option + kombinasi aksara atau Character Viewer. Linux: Ctrl+Shift+U + kod heksadesimal. Atau salin dari alat ini dan tampal di mana diperlukan.

Advertisement