รหัสข้อมูล
(Data Representation) หมายถึง รหัสที่ใช้แทนตัวเลข ตัวอักษร
สัญลักษณ์ต่างๆ ที่ประกอบอยู่ในคำสั่ง และข้อมูล เพื่อใช้ในการประมวลผล
สามารถแบ่งได้ 2 ประเภทคือ
- รหัสภายในระบบคอมพิวเตอร์
(Internal Code) เป็นรหัสที่ใช้แทนข้อมูลในหน่วยความจำของคอมพิวเตอร์
เช่น
- รหัส
BCD - Binary Code Decimal
- รหัส
EBCDIC - Extended Binary Coded Decimal Interchange Code
- รหัส
ASCII - American Standard Code for Information Interchange
- รหัส
สมอ.
- รหัส
Unicode
- รหัสภายนอกระบบคอมพิวเตอร์
(External Code) เป็นรหัสที่พัฒนาสำหรับบันทึกข้อมูลนอกเครื่องคอมพิวเตอร์
เช่นรหัสที่ใช้กับบัตรเจาะรู
รหัสภายในคอมพิวเตอร์
แทนได้กับสภาวะของกระแสไฟฟ้า ตามจำนวนสายสัญญาณ เช่น ถ้ามีสายสัญญาณ
2 เส้น ก็สามารถสร้างรหัสแทนข้อมูลได้ 4 ค่า (คิดจาก 22)
คือ
สภาวะไฟฟ้า
2 เส้น |
รหัสข้อมูล |
|
00 |
|
01 |
|
10 |
|
11 |
ดังนั้นถ้ามีสายสัญญาณ
8 เส้น ก็สามารถสร้างรหัสแทนข้อมูลได้ จำนวน 28 =
256 ค่า เป็นต้น
สภาวะไฟฟ้า
8 เส้น |
รหัสข้อมูล |
|
00000000 |
|
00000001 |
|
11111111 |
บิต
(Bit)
สภาวะไฟฟ้า
1 เส้น หรือค่า 0 หรือ 1 แต่ละค่าเรียกว่า บิต (Bit) ซึ่งเป็นคำย่อของ
"BInary digiT"
ไบต์
(Byte)
กลุ่มของบิตที่มีความหมายเฉพาะเรียกว่า
ไบต์ (Byte) ดังนั้นถ้ามีสายสัญญาณ 8 เส้น แสดงว่ามีสัญญาณที่สามารถผสมผสานกันได้
8 บิต เมื่อนำค่าสัญญาณต่างๆ มาผสมผสานกัน ก็สามารถสร้างรหัสแทนข้อมูลได้
จำนวน 28 = 256 ค่า เป็นต้น ดังตัวอย่างในตารางที่แสดงอักขระ,
การเรียงกันของบิต และค่าเลขฐาน 10 ที่แทนอักขระ
Character |
Bit pattern |
Byte
number |
|
Character |
Bit pattern |
Byte
number |
A |
01000001 |
65 |
|
ผ |
10111100 |
188 |
B |
01000010 |
66 |
|
. |
00101110 |
46 |
C |
01000011 |
67 |
|
: |
00111010 |
58 |
a |
01100001 |
97 |
|
$ |
00100100 |
36 |
b |
01100010 |
98 |
|
\ |
01011100 |
92 |
o |
01101111 |
111 |
|
~ |
01111110 |
126 |
p |
01110000 |
112 |
|
1 |
00110001 |
49 |
q |
01110001 |
113 |
|
2 |
00110010 |
50 |
r |
01110010 |
114 |
|
9 |
00111001 |
57 |
x |
01111000 |
120 |
|
ฉ |
10101001 |
169 |
y |
01111001 |
121 |
|
> |
00111110 |
62 |
z |
01111010 |
122 |
|
|
10001001 |
137 |
ดังนั้นถ้าต้องการป้อนคำว่า
Hello จะมีค่าเท่ากับข้อมูลจำนวน 6 ไบต์ ซึ่งมักจะได้ยินว่า
1 ไบต์ เทียบกับ 1 ตัวอักษรนั่นเอง
|