ASCII

Kod Piawai Amerika untuk Pertukaran Maklumat atau juga dikenali dengan singkatan Inggerisnya ASCII ("American Standard Code for Information Interchange") adalah satu format yang lazim digunakan untuk fail teks dalam komputer dan internet. Kod ASCII telah dibangunkan oleh American National Standards Institute (ANSI).

Terdapat 95 kod ASCII yang boleh dicetak, yang dinomborkan dari 32 hingga 126.

Dalam fail yang menggunakan kod ASCII, setiap aksara (angka, abjad dan simbol khas) diwakili oleh sejumlah 7 bit nombor perduaan yang terdiri daripada rentetan tujuh '0' atau '1'. Ia melibatkan sejumlah 128 aksara biasa dengan tambahan 128 aksara lanjutan.


Saya telah mengesahkan cadangan yang telah diberikan oleh Setiausaha Kewangan berkenaan dengan piawaian yang perlu diwujudkan semasa merakam Kod Piawai untuk kegunaan Perkongsian maklumat di atas pita magnetik dan pita kertas semasa digunakan di atas komputer.Semua komputer atau peralatan yang mempunyai konfigurasi yang hampir serupa yang di bawa masuk ke dalam senarai peralatan kerajaan Federal pada dan selepas 1 Julai 1969 hendaklah mempunyai kemampuan untuk menggunakan Kod Piawai untuk kegunaan Perkongsian maklumat dan format piawai untuk pita magnetik dan pita kertas jika bahan ini akan digunakan.

Pengenalan

Seperti kod-kod komputer yang lain, ASCII memberikan rujukan yang spesifik kepada susunan bit digital dan juga glyph (contohnya simbol) untuk sebuah bahasa penulisan. Ini membolehkan peralatan digital berkomunikasi antara satu sama lain untuk memproses, menyimpan dan berkomunikasi menggunakan maklumat berdasarkan simbol.Proses "encode" Kod ASCII [1]- atau "compatible extension" - digunakan hampir di setiap komputer umum, terutama komputer peribadi dan pusat pekerjaan. Nama MIME yang digunakan untuk proses "encode" ini adalah "US-ASCII".".[2]


Walaupun pengecualian kepada beberapa Kod Kawalan ASCII yang menggunakan format berdasarkan barisan,ko ASCII tidak ditakrifkan di mana-mana mekanisma untuk takrifan kepada struktur atau penampilan sesebuah perkataan didalam sebuah dokumen. Skema lain seperti bahasa markup, alamat dan format dokumen.

Kod ASCII adalah kod tujuh bit, ini bermakna ia menggunakan susunan tujuh angka binari dari angka desimal 0 hingga 127 untuk mewakili setiap simbol. Sewaktu kod ASCII diperkenalkan, banyak komputer pasa masa itu menggunakan lapan-bit bait ( kumpulan bit, yang dikenali sebagai Oktet, sebagai unit terkecil untuk data. Di dalam kod ASCII tujuh-bit, bit ke-8 biasanya digunakan sebagai bit pariti untuk memeriksa jika terdapat sebarang kesalahan didalam talian komunikasi atau untuk fungsi peralatan yang lain. Mesin yang menggunakan pemeriksaan pariti biasanya akan menetapkan bit kelapan kepada 0.[3]


Institut Piawai Nasional Amerika ( the United States of America Standards Institute atau USASI) telah membangunakan kod ASCII merujuk kepada sistem enkod mesin telepencetak terdahulu. Di dalam linkungan tahun 1956an, Ivan Idelson di Ferranti di UK, telah memulakan penggunaan kod Cluff-Foster-Idelson diatas 7 pita kertas perentas untuk komuniti BSI. Kod ini telah menjadi kod ASCII. Kod ASCII sendiri telah buat pertama kalinya digunakan secara komersil pada tahun 1963 sebagai kod tujuh-bit untuk telepencetak yang digunakan oleh rangkaian American Telephone & Telegraph's TWX (Teletype Wide-area eXchange). TWX pada asalnya menggunakan kod lima-bitkod Baudot, yang juga digunakan oleh syarikat pencabar meraka iaitu sistem Telex telepencetak. Sistem Belll telah merancang untuk menaik taraf ke kod enam-bit sehubungan daripada projek Fieldata, yang telah memuatkan tanda kata nama dan juga huruf kecil ke dalam kod Baudot. Namun telah dipujuk untuk memasuki Pertubuhan Standard Amerika ( merupakan cabang dari Institut Standard Nasional Amerika ANSI) sebagai salah satu daripada rangkaian komiti yang telah memulakan pembangunan kod ASCII.[perlu rujukan]

Jika dibandingkan dengan kod telegraf terdahulu, seperti contoh kod Bell dan kod ASCII, kedua-duanya telah melalui susunan semua untuk kesesuaian penyusunan kod terutama dari segi abjab di dalam sebuah senarai. Selain itu, terdapat tambahan beberapa fungsi kepada peralatan lain selain telepencetak. Bob Bemer telah memperkenalkan fungsi baru seperti contoh aturan escape.[perlu rujukan] Rakannya Hugh McGregor Ross telah membantu untuk memperkenalkan hasilnya itu mengikut kata Bemer, "kod ASCII yang asal adalah dikenali sebagai kod Bemer-Ross di Eropah".[perlu rujukan]

Kod ASCII telah dikemaskini dari masa ke semasa dan telah dicetak sebagai USASI X3.4-1968, ANSI X3.4-1977, dan akhirnya ANSI X3.4-1986.

Pertubuhan-pertubuhan Piawai Antarabangsa yang lain telah memperkenalkan kod-kod lain seperti ISO 646, dimana kod ini mempunyai banyak persamaan dan hampir sama dengan kod ASCII, dengan penambahan untuk beberapa simbol yang digunakan oleh kawasan atau negara-negara tersebut di mana tidak terdapat di dalam abjab Inggeris, selain simbol-simbol matawang seperti contoh Matawang United Kingdom yang menggunakan Pound Sterling (£). Walaupun kod-kod ini kadangkalanya merujuk kepada ASCII, namun ASCII yang asli adalah mengikut piawaian ANSI.


Kod ASCII telah dimasukkan didalam penggantinya unikod sebagai simbol 128 dan kebawah.

Simbol kawalan ASCII

ASCII menyimpan 32 kod pertama (nombor 0-31 titik perpuluhan) untuk dijadikan sebagai Simbol kawalan: kod asal yang tidak membawa sebarang maklumat yang boleh dicetak, namun begitu selain untuk mengawal peralatan seperti mesin cetak yang menggunakan ASCII, atau untuk menyediakan maklumat-meta mengenai laluan data seperti yang tersimpan di atas pita magnetik. Sebagai contoh, simbol 10 membawa maksud fungsi "line feed" yang akan menyebabkan mesin cetak menggerakkan kertas ke hadapan dan simbol 8 adalah merujuk kepada "backspace".

lihat Seni ASCII

DeduaOktDekHeksKepPTPTKKKLA}}Penerangan
000 0000000000NUL^@\0Null character
000 0001001101SOH^AStart of Header
000 0010002202STX^BStart of Text
000 0011003303ETX^CEnd of Text
000 0100004404EOT^DEnd of Transmission
000 0101005505ENQ^EEnquiry
000 0110006606ACK^FAcknowledgment
000 0111007707BEL^G\aBell
000 1000010808BS^H\bBackspace[d][i]
000 1001011909HT^I\tHorizontal Tab
000 1010012100ALF^J\nLine feed
000 1011013110BVT^K\vVertical Tab
000 1100014120CFF^L\fForm feed
000 1101015130DCR^M\rCarriage return[h]
000 1110016140ESO^NShift Out
000 1111017150FSI^OShift In
001 00000201610DLE^PData Link Escape
001 00010211711DC1^QDevice Control 1 (oft. XON)
001 00100221812DC2^RDevice Control 2
001 00110231913DC3^SDevice Control 3 (oft. XOFF)
001 01000242014DC4^TDevice Control 4
001 01010252115NAK^UNegative Acknowledgement
001 01100262216SYN^VSynchronous Idle
001 01110272317ETB^WEnd of Trans. Block
001 10000302418CAN^XCancel
001 10010312519EM^YEnd of Medium
001 1010032261ASUB^ZSubstitute
001 1011033271BESC^[\e[f]Escape[g]
001 1100034281CFS^\File Separator
001 1101035291DGS^]Group Separator
001 1110036301ERS^^Record Separator
001 1111037311FUS^_Unit Separator
111 11111771277FDEL^?Delete[e][i]


Kod ASCII yang asal hanya menggunakan kosakata diskripsi yang pendek untuk semua simbol kawalan. Kadangkala, keadaan ini dibiarkan dengan sengaja (di mana simbol akan digunakan dengan cara yang berlainan di atas sambungan terminal berbanding dengan saluran data) dan kadangkala menyebabkan lebih banyak ketidaksinambungan (sepertimana "padam" bermaksud).

Secara dasarnya, Teletype corporation model siri 33 merupakan peralatan yang telah memberikan pengaruh besar kepada interpretasi simbol-simbol ini. Peralatan ini merupakan sebuah terminal percetakan yang dilengkapi dengan teknologi pita kertas untuk menebuk lubang dan mentafsirnya. Pita kertas merupakan antara medium yang terkenal untuk pengaturcaraan simpanan data jangka masa panjang sehingga tahun 1980an, dan menggunakan kos perkhidmatan yang rendah dan dalam masa yang sama lebih lasak jika dibandingakan dengan pita magnet. Selain itu, mesin Teletype 33 menggunakan kod 17 (Control-Q, DC1, juga dikenali sebagai XON), 19 (Control-S, DC3, juga dikenali sebagai XOFF), dan 127 (Padam) telah menjadi simbol de-facto standard. Oleh kerana kekunci atas untuk kekunci O boleh jua memaparkan simbol anak panah kiri ( dari ASCII-1963, yang mempunyai simbol ini disebalik simbol underscore), penggunaan kod 15 (Control-O, Shift In) yang tidak rasmi juga di takrifkan sebagai "padam simbol sebelumnya" juga telah digunakan oleh kebanyakan sistem perkongsian masa tetapi telah berkurangan disebabkan keadaan.


Penggunaaan Control-S (XOFF, simbol untuk "transmisi Nyahaktif") sebagai simbol amaran tangan bersalaman untuk menyuruh penghantar supaya menghentikan tranmisi disebabkan oleh arus lebihan, dan Control-Q (XON, "transmisi aktif") untuk menyambung penghantaran, dimana boleh dibandingkan dengan teknik yang digunakan pada hari ini di dalam sistem-sistem sebagai teknik kawalan data keluar secara manual. Di dalam sesetengah sistem, Control-S mengekalkan fungsinya tetapi Control-Q digantikan dengan Control-S kedua untuk fungsi penyambungan penghantaran data.

Simbol kawalan ruang bukan putih

RFC 2822 merujuk kepada NO-WS-CTL, Simbol kawalan ruang bukan putih. Simbol-simbol ini adalah simbol kawalan yang tidak memasukkan pembawa kembali (carriage return), pengisi barisan (line feed) dan simbol ruang putih (white space character)(lihat disini), contohnya: huruf desimal 1–8, 11–12, 14–31, dan 127.

Simbol ASCII yang boleh dicetak

Kod 32, simbol "space", memberikan jarak antara dua perkataan, hasilnya adalah seperti apabila kita menekan "spacebar" di atas papan kekunci di atas komputer.Kod 32 hingga 126, dikenali sebagai simbol yang boleh dicetak, mewakili huruf, angka, tanda seruan, dan beberapa simbol yang lain.

ASCII tujuh-bit memberikan tujuh simbol "national" dan, jikalau peralatan dan perisian membenarkan. Overstrikes boleh digunakan untuk memaparkan simbol antarabangsa tambahan: di dalam senario ini, "backspace" boleh di gunakan sebagai grave accent (di mana sebagai standard penduduk Amerika dan British, tetapi hanya standard berikut juga dikenali sebagai "opening single quoation mark"), backtick atau breath mark (inverted vel).

BinaryOctDecHexGlyph
010 00000403220SP
010 00010413321!
010 00100423422"
010 00110433523#
010 01000443624$
010 01010453725%
010 01100463826&
010 01110473927'
010 10000504028(
010 10010514129)
010 1010052422A*
010 1011053432B+
010 1100054442C,
010 1101055452D-
010 1110056462E.
010 1111057472F/
011 000006048300
011 000106149311
011 001006250322
011 001106351333
011 010006452344
011 010106553355
011 011006654366
011 011106755377
011 100007056388
011 100107157399
011 1010072583A:
011 1011073593B;
011 1100074603C<
011 1101075613D=
011 1110076623E>
011 1111077633F?
BinaryOctDecHexGlyph
100 00001006440@
100 00011016541A
100 00101026642B
100 00111036743C
100 01001046844D
100 01011056945E
100 01101067046F
100 01111077147G
100 10001107248H
100 10011117349I
100 1010112744AJ
100 1011113754BK
100 1100114764CL
100 1101115774DM
100 1110116784EN
100 1111117794FO
101 00001208050P
101 00011218151Q
101 00101228252R
101 00111238353S
101 01001248454T
101 01011258555U
101 01101268656V
101 01111278757W
101 10001308858X
101 10011318959Y
101 1010132905AZ
101 1011133915B[
101 1100134925C\
101 1101135935D]
101 1110136945E^
101 1111137955F_
BinaryOctDecHexGlyph
110 00001409660`
110 00011419761a
110 00101429862b
110 00111439963c
110 010014410064d
110 010114510165e
110 011014610266f
110 011114710367g
110 100015010468h
110 100115110569i
110 10101521066Aj
110 10111531076Bk
110 11001541086Cl
110 11011551096Dm
110 11101561106En
110 11111571116Fo
111 000016011270p
111 000116111371q
111 001016211472r
111 001116311573s
111 010016411674t
111 010116511775u
111 011016611876v
111 011116711977w
111 100017012078x
111 100117112179y
111 10101721227Az
111 10111731237B{
111 11001741247C|
111 11011751257D}
111 11101761267E~

Struktur ASCII

  • Angka 0-9 diwakili oleh nilai mereka di dalam angka binari menggunakan 0011 ( ini bermaksud, mengubah BCD kepada ASCII adalah dengan hanya mengambil BCD masing-masing secara berasingan dan menambah 0011 kepadanya.
  • Huruf kecil dan huruf besar hanya berbeza dari segi Susunan bit dengan perbezaan 1 bit sahaja, dengan meringkaskan kotak pertukaran kepada ujian terhad ( untuk mengelakkan pertukaran simbol yang bukan huruf) dan hanya satu operasi bit. Kotak pertukaran pantas adalah penting kerana ia sering digunakan untuk situasi pengabaian simbol di dalam carian algoritma .
  • Perbandingan dengan EBCDIC, huruf kecil dan huruf besar masing-masing memenuhi 26 posisi secara berturutan.


Rujukan