Peneroka Aksara Unicode

Cari, terokai dan salin aksara serta simbol Unicode

Semua penerokaan aksara dilakukan secara setempat dalam pelayar anda.

Tentang Peneroka Aksara Unicode

Peneroka Aksara Unicode percuma ini membantu anda mencari, melayari dan menyalin aksara Unicode, simbol, emoji dan aksara khas. Dengan lebih daripada 140,000 aksara dalam piawaian Unicode, mencari simbol yang betul boleh menjadi mencabar - alat ini memudahkannya.

Cari mengikut nama aksara, tampal sesuatu aksara untuk melihat butirannya, atau masukkan code point Unicode (seperti U+2192 atau →). Layari mengikut blok Unicode untuk menemui aksara berkaitan. Semua pemprosesan dilakukan secara setempat dalam pelayar anda untuk hasil segera.

Sesuai untuk pembangun, pereka, penulis dan sesiapa sahaja yang memerlukan akses pantas kepada aksara Unicode.

Cara Menggunakan

  1. Cari mengikut nama: Taip kata kunci seperti "arrow", "heart" atau "copyright" untuk mencari aksara
  2. Cari mengikut aksara: Tampal mana-mana aksara (seperti →, © atau 🎉) untuk melihat maklumat Unicode
  3. Cari mengikut kod: Masukkan code point Unicode dalam format seperti:
    • U+2192 (notasi Unicode)
    • → (entiti perpuluhan HTML)
    • → (entiti heksadesimal HTML)
    • 0x2192 (heksadesimal)
    • 8594 (perpuluhan)
  4. Layari mengikut blok: Pilih blok Unicode daripada dropdown untuk melihat semua aksara dalam julat tersebut
  5. Salin aksara: Klik mana-mana kad aksara untuk menyalin aksara ke papan klip
  6. Lihat butiran: Lihat code point Unicode, entiti HTML, nilai perpuluhan/heksadesimal dan nama aksara

Ciri-ciri

  • Carian Menyeluruh: Cari mengikut nama aksara, code point atau aksara itu sendiri
  • Pelbagai Format: Menyokong format U+, &#, &#x, 0x dan code point perpuluhan
  • Blok Unicode: Layari aksara yang disusun mengikut blok Unicode
  • Butiran Aksara: Lihat kod Unicode, entiti HTML, nilai perpuluhan/heksadesimal dan nama
  • Salinan Satu Klik: Salin aksara, code point atau entiti HTML dengan segera
  • Pratonton Visual: Paparan aksara besar untuk pengecaman mudah
  • Pantas & Luar Talian: Berfungsi sepenuhnya dalam pelayar anda tanpa permintaan pelayan
  • Mesra Mudah Alih: Reka bentuk responsif penuh untuk semua peranti

Privasi & Keselamatan

Privasi anda penting. Alat ini memproses semua data sepenuhnya dalam pelayar anda.

  • Tiada data dihantar ke mana-mana pelayan
  • Tiada log atau penjejakan carian anda
  • Berfungsi sepenuhnya di luar talian selepas halaman dimuatkan
  • Selamat untuk meneroka mana-mana aksara Unicode

Kegunaan Lazim

  • Pembangunan Web: Cari entiti HTML dan kod Unicode untuk aksara khas
  • Penciptaan Kandungan: Temui simbol, anak panah dan aksara hiasan untuk dokumen
  • Media Sosial: Cari emoji dan aksara khas untuk siaran dan profil
  • Kerja Reka Bentuk: Teroka simbol tipografi dan aksara khas
  • Dokumentasi: Cari simbol teknikal, operator matematik dan notasi
  • Kandungan Pelbagai Bahasa: Akses aksara daripada pelbagai sistem tulisan
  • Pengaturcaraan: Semak code point Unicode untuk pengendalian string
  • Kebolehcapaian: Cari aksara yang sesuai dan pelajari nama rasminya

Istilah & Konsep Utama

Unicode

Unicode ialah piawaian pengekodan aksara sejagat yang memberikan nombor unik (code point) kepada setiap aksara, simbol dan emoji merentas semua sistem tulisan dan bahasa. Ia membolehkan perwakilan teks yang konsisten merentas platform, peranti dan aplikasi yang berbeza.

Code Point

Code point ialah pengecam angka unik yang diberikan kepada setiap aksara dalam Unicode, biasanya ditulis sebagai U+XXXX di mana XXXX ialah nombor heksadesimal. Contohnya, U+0041 ialah code point untuk huruf "A", dan U+2192 ialah anak panah ke kanan "→".

Blok Unicode

Blok Unicode ialah julat code point berterusan yang dikumpulkan mengikut skrip, tujuan atau tema. Contohnya termasuk "Latin Asas" (U+0000–U+007F), "Greek dan Coptic" (U+0370–U+03FF) dan "Anak Panah" (U+2190–U+21FF). Blok membantu menyusun ruang aksara Unicode.

Entiti HTML

Entiti HTML ialah rentetan teks yang mewakili aksara Unicode dalam dokumen HTML/XML. Ia boleh dinamakan (seperti © untuk ©) atau berbentuk angka (seperti © untuk © atau © untuk ©). Ia memastikan aksara dipaparkan dengan betul tanpa mengira pengekodan dokumen.

UTF-8

UTF-8 ialah format pengekodan Unicode paling biasa yang digunakan di web. Ia mewakili setiap code point Unicode sebagai jujukan 1-4 bait. UTF-8 serasi ke belakang dengan ASCII dan mengekod aksara daripada semua bahasa dengan cekap.

Kategori Aksara

Unicode memberikan setiap aksara kepada satu kategori yang menerangkan sifat amnya, seperti Huruf (L), Nombor (N), Tanda Baca (P), Simbol (S), Tanda (M), Pemisah (Z) atau Lain-lain (C). Kategori membantu program mengenal pasti dan memproses aksara dengan betul.

BMP (Basic Multilingual Plane)

BMP ialah 65,536 code point pertama (U+0000 hingga U+FFFF) dalam Unicode yang mengandungi aksara untuk kebanyakan bahasa moden dan banyak simbol. Aksara di luar BMP dipanggil aksara tambahan dan memerlukan pengendalian khas dalam sesetengah sistem.

Contoh

Contoh 1: Mencari Simbol Anak Panah

Carian: "arrow"

Hasil: → (U+2192 RIGHTWARDS ARROW), ← (U+2190 LEFTWARDS ARROW), ↑ (U+2191 UPWARDS ARROW), ↓ (U+2193 DOWNWARDS ARROW)

Gunakan anak panah ini dalam dokumentasi, reka bentuk UI atau di mana-mana penunjuk arah diperlukan.

Contoh 2: Menyemak Sesuatu Aksara

Carian: © (tampal simbol hak cipta)

Butiran Hasil:

  • Unicode: U+00A9
  • Entiti HTML: © atau © atau ©
  • Perpuluhan: 169
  • Nama: COPYRIGHT SIGN

Contoh 3: Mencari Simbol Matematik

Layari: Pilih blok "Operator Matematik"

Temui: ∑ (jumlah), ∫ (kamiran), ≈ (hampir sama), ≠ (tidak sama), ∞ (infiniti), √ (punca kuasa dua)

Sesuai untuk notasi matematik dalam dokumen atau bahan pendidikan.

Contoh 4: Format Code Point

Semua format ini merujuk kepada aksara yang sama (→):

  • U+2192 (notasi Unicode)
  • → (HTML perpuluhan)
  • → (HTML heksadesimal)
  • 0x2192 (heksadesimal pengaturcaraan)
  • 8594 (nombor perpuluhan)

Nota Penting

Sokongan Font: Tidak semua font merangkumi semua aksara Unicode. Jika anda melihat kotak segi empat (□) atau tanda soal (?), aksara itu memang wujud tetapi font sistem anda tidak menyokongnya. Aksara itu masih akan disalin dengan betul.
Keserasian Pelayar: Pelayar moden menyokong piawaian Unicode penuh. Pelayar atau sistem lama mungkin mempunyai sokongan terhad untuk aksara Unicode yang lebih baharu, terutamanya emoji dan aksara tambahan.
Teks Kanan-ke-Kiri: Sesetengah blok Unicode mengandungi skrip kanan-ke-kiri (Arab, Ibrani). Ini mungkin kelihatan terbalik atau menyebabkan isu susun atur bergantung pada konteks. Gunakan atribut direction HTML yang sesuai apabila perlu.
Aksara Gabungan: Sesetengah aksara Unicode ialah combining marks yang mengubah suai aksara lain (seperti aksen). Ia tidak akan dipaparkan dengan betul secara berasingan tetapi berfungsi apabila mengikut aksara asas.
Kawasan Kegunaan Persendirian: Unicode merangkumi kawasan kegunaan persendirian untuk aksara tersuai. Ia tidak mempunyai rupa standard dan mungkin dipaparkan secara berbeza pada sistem berbeza atau tidak dipaparkan langsung.
Variasi Emoji: Banyak emoji mempunyai beberapa code point bergantung pada tona kulit, jantina atau gaya. Sesetengah emoji terdiri daripada berbilang code point yang digabungkan bersama (seperti emoji keluarga).
Kepekaan Huruf Besar/Kecil: Unicode membezakan huruf besar dan huruf kecil sebagai aksara berasingan. "A" (U+0041) dan "a" (U+0061) ialah code point yang berbeza.

Soalan Lazim

Apakah itu Unicode?

Unicode ialah piawaian pengekodan aksara sejagat yang memberikan code point unik kepada setiap aksara, simbol dan emoji merentas semua bahasa dan sistem tulisan. Ia membolehkan perwakilan teks yang konsisten merentas platform, peranti dan aplikasi di seluruh dunia.

Bagaimana saya mencari aksara Unicode?

Anda boleh mencari dengan pelbagai cara: taip kata kunci deskriptif (seperti "heart" atau "arrow"), tampal aksara itu sendiri untuk melihat butirannya, masukkan code point Unicode (U+2192), entiti HTML (→), atau layari dengan memilih blok Unicode daripada menu dropdown.

Apakah itu code point Unicode?

Code point ialah pengecam angka unik untuk setiap aksara Unicode, ditulis sebagai U+XXXX di mana XXXX ialah nombor heksadesimal. Contohnya, U+0041 ialah "A" dan U+2192 ialah "→". Setiap satu daripada lebih 140,000 aksara Unicode mempunyai code point tersendiri.

Bagaimana saya menggunakan aksara Unicode dalam HTML saya?

Salin aksara itu secara terus atau gunakan entiti HTML-nya. Entiti bernama seperti © berfungsi untuk aksara biasa. Entiti angka seperti © (perpuluhan) atau © (heksadesimal) berfungsi untuk mana-mana aksara. Tetapkan charset HTML anda kepada UTF-8 untuk penggunaan aksara secara terus.

Mengapa sesetengah aksara dipaparkan sebagai kotak atau tanda soal?

Kotak atau tanda soal menunjukkan font semasa anda tidak merangkumi aksara tersebut. Aksara itu masih wujud dan akan disalin dengan betul. Pasang font yang menyeluruh seperti "Noto Sans" atau gunakan font-family fallback untuk memaparkan lebih banyak aksara Unicode.

Apakah perbezaan antara blok Unicode?

Blok Unicode ialah julat berterusan yang mengumpulkan aksara berkaitan. "Latin Asas" mengandungi huruf Inggeris, "Anak Panah" mengandungi simbol anak panah, "CJK" mengandungi aksara Cina/Jepun/Korea dan sebagainya. Blok membantu menyusun lebih 140,000 aksara Unicode kepada kategori yang lebih mudah diurus.

Adakah data carian saya dihantar ke mana-mana pelayan?

Tidak, semua penerokaan dan carian aksara berlaku sepenuhnya dalam pelayar anda. Carian dan data anda tidak pernah meninggalkan peranti anda, menjadikan alat ini benar-benar peribadi dan selamat.

Bolehkah saya menggunakan aksara Unicode dalam pengaturcaraan?

Ya, kebanyakan bahasa pengaturcaraan moden menyokong Unicode. Gunakan notasi code point (contohnya, \u2192 dalam JavaScript, \u{2192} dalam Python 3, atau \x{2192} dalam Perl) atau sertakan aksara secara terus dalam fail sumber yang dikodkan dengan UTF-8. Semak dokumentasi Unicode bahasa anda.

Apakah itu aksara gabungan?

Aksara gabungan ialah aksara Unicode khas yang mengubah suai aksara sebelumnya, seperti aksen atau tanda diakritik. Contohnya, combining acute accent (U+0301) selepas "e" membentuk "é". Ia tidak dipaparkan dengan betul secara bersendirian tetapi akan bergabung dengan aksara asas.

Bagaimana saya menaip aksara Unicode pada papan kekunci?

Kaedah berbeza mengikut sistem. Windows: Alt + kod angka. Mac: gabungan Option + aksara atau Character Viewer. Linux: Ctrl+Shift+U + kod heksadesimal. Atau salin daripada alat ini dan tampal di mana-mana yang diperlukan.

Advertisement