หน่วยที่ 2 ข้อมูลและสารสนเทศ
2.3 ข้อมูลในคอมพิวเตอร์
คอมพิวเตอร์ทํางานด้วยหลักการทางอิเล็กทรอนิกส์ที่ใช้สัญญาณทางไฟฟ้าแทนตัวเลขศูนย์และหนึ่ง ซึ่งเป็น ตัวเลขในระบบเลขฐานสอง แต่ละหลักเรียกว่าบิต(binary digit : bit) และเมื่อนําตัวเลขหลายๆบิตมาเรียงกันจะ ใช้สร้างรหัสแทนจํานวนอักขระหรือสัญลักษณ์ทั้งภาษาไทยและภาษาอังกฤษได้ และเพื่อให้การแลกเปลี่ยน ข้อความระหว่างมนุษย์กับคอมพิวเตอร์เป็นไปในแนวเดียวกัน จึงมีการกําหนดมาตรฐานรหัสแทนข้อมูลในระบบ เลขฐานสองขึ้น โดยรหัสมาตรฐานที่นิยมใช้กันมากมีสองกลุ่ม คือ รหัสยูนิโค้ดและแอสกี
2.3.1 ระบบเลขฐานสอง
ในชีวิตประจําวั นของมนุ ษย์ต้ องได้พบเจอกับจํ านวนและการคํานวณอยู่ ทุกวัน หากเราสังเกตจะ พบว่าจํานวนที่เราคุ้นเคยอยู่ ทุกวันนั้นไม่ว่าจะเป็นการซื้อของเป็นเงิน 39,587 บาท จํานวนเงินฝากใน ธนาคาร 1,426,000 บาท หรือจํานวนในใบแจ้งหนี้ค่าโทรศัพท์จํานวน2,560 บาท ล้วนแล้วแต่ประกอบ ขึ้นจากตัวเลข10 ตัว คือ0,1,2,3,4,5,6,7,8 และ9 ทั้งสิ้น ตัวเลขทั้ ง10 ตัวนี้ถือได้ว่าเป็นเครื่องมือที่ช่วย ในการนับจํานวนของมนุษย์ การที่มนุษย์เลือกเลข10 ตัวในการแทนการนับ อาจเนื่องจากมนุษย์มีนิ้วมือ ที่สามารถใช้เป็นอุปกรณ์ช่วยนับได้เพียง10 นิ้ว จึงกําหนดระบบตัวเลขนี้ขึ้นมาและเรียกว่า ระบบ เลขฐานสิบ(decimal) ต่อมาเมื่อมีการใช้งานคอมพิวเตอร์ซึ่งเป็นอุปกรณ์อิเล็กทรอนิกส์ ที่ทํางาน แบบดิจิทัลและใช้ระดับ แรงดันไฟฟ้าแสดงสถานะเพียง 2 สถานะ คือ ปิด(แทนด้วย 0) และเปิด(แทนด้วย 1) หรืออาจ กล่าวได้ว่าเครื่องคอมพิวเตอร์รู้จักตัวเลขเพียง 2 ตัวเท่านั้น คือ 0 และ 1 หากมนุษย์ต้องการใช้ คอมพิวเตอร์เป็นเครื่องมือช่วยทํางาน มนุษย์ต้องเรียนรู้ระบบเลขที่ประกอบด้วยตัวเลขเพียง 2 ตัวเช่นกัน จึงได้มี การคิดค้นระบบเลขฐานสอง (binary) ขึ้นเพื่อช่วยในการสื่อสารกับเครื่องคอมพิวเตอร์ โดยระบบ เลขฐานสองเป็นระบบตัวเลขที่ ประกอบด้วยตัวเลขเพียง 2 ตัว คือ 0 และ 1 เท่านั้น ตัวอย่างเลขฐานสอง เช่น 1102, 101102
นอกจากระบบเลขฐานสองแล้ว ในการทํางานของคอมพิวเตอร์ยังอาจเกี่ยวข้ องกับระบบตัวเลข ระบบอื่นอีก เช่น ระบบเลขฐานแปดและระบบเลขฐานสิบหกซึ่งระบบเลขฐาน ทั้งสองจะมีแนวคิดใน ทํานองเดียวกันกับระบบเลขฐานสองและฐานสิบ กล่าวคือระบบเลขฐานแปดก็คื อระบบเลขที่ ประกอบด้วยตัวเลขเพียง 8 ตัว คือ 0,1,2,3,4,5,6, และ 7 ตัวอย่างเลขฐานแปด เช่น 16738 765138 ในขณะที่ระบบเลขฐานสิบหกนั้ นจะประกอบด้วย ตัวเลขทั้ง 10 ตัวที่ใช้อยู่ในระบบเลขฐานสิบ และเพิ่ม ตัวอักขระภาษาอังกฤษ A , B , C , D , E และ F แทนจํานวน 10 11 12 13 14 และ 15 ตามลําดับ ตัวอย่างเลขฐานสิบหก เช่น A154916 F7DA216 874316 จากที่ กล่าวมาข้างต้น จะเห็นว่าการเขียนเลขฐานสอง ฐานแปดและฐานสิบหกนั้น มักจะเขียนตัวเลข 2 8 และ 16 กํากับอยู่ที่ตัวสุดท้าย ทั้งนี้เพื่อป้องกันความสับสน เช่น 8743 หากเราไม่เขียนตัวเลขกํากับ ไว้ ตัวเลขนี้อาจเป็นเลขฐาน 10 หรือฐาน 16 ก็ได้เราก็จะไม่ทราบว่าตัวเลขที่เขียนนั้นเป็นเลขฐานใด ตารางด้านล่างนี้เป็นตารางแสดงค่าของตัวเลขในระบบเลขฐานทั้งสี่ระบบที่กล่าวถึงข้างต้น
ตารางที่ 2.1 รูปแบบของเลขฐานสอง ฐานสิบ ฐานแปด และฐานสิบหก
2.3.2 รหัสแทนข้อมูล
ขอยกตัวอย่างที่นิยมใช้ในปัจจุบัน 2 รูปแบบคือ
1) รหัสแอสกี(American Standard Code Information Interchange :ASCII) เป็น มาตรฐานที่นิยมใช้กันมากในระบบคอมพิวเตอร์และระบบสื่อสารข้อมูล รหัสแทนข้อมูลชนิดนี้ใช้ เลขฐานสองจํานวน 8 บิตหรือเท่ากับ1 ไบต์แทนอักขระหรือสัญลักษณ์แต่ละตัว ซึ่งหมายความว่าการ แทนอักขระแต่ละตัวจะประกอบด้วยตัวเลขฐานสอง8 บิตเรียงกัน ซึ่งลําดับของแต่ละบิตเป็นดังนี
รูปที่ 2.4 รหัสแทนข้อมูลแบบรหัสแอสกี
จากหลักการของระบบเลขฐานสอง แต่ละบิตสามารถแทนค่าได้2 แบบ คือ เลข0 หรือเลข1 ถ้าเราเขียนเลขฐานสองเรียงกัน 2 บิตในการแทนอักขระ เราจะมีรูปแบบในการแทนอักขระได้ (22) หรือ 4 รูปแบบ คือ 00 , 01 , 10 และ 11 ดังนั้นในการใช้รหัสแอสกีซึ่งมี 8 บิตในการแทนอักขระแล้ว เราจะมี รูปแบบที่ใช้แทนได้ถึง 28 หรือ 256 รูปแบบ ซึ่งเมื่อใช้แทนตัวอักษรภาษาอังกฤษแล้วยังมีเหลืออยู่ สํานักงานมาตรฐานผลิตภัณฑ์อุตสาหกรรมหรือ สมอ. จึงได้กําหนดรหัสภาษาไทยเพิ่มลงไปเพื่อให้ใช้งาน ร่วมกันตามตารางแสดงรหัสASCII ดังนี้
ตารางที่ 2.2 รหัส ASCII แทนตัวอักษรภาษาไทยและภาษาอังกฤษ
2) รหัสยูนิโค้ด(Unicode) เป็นรหัสที่สร้างขึ้นมาในระยะหลังที่มีการสร้างแบบตัวอักษรของ ภาษาต่างๆ รหัสยูนิโค้ดช้เลขฐานสอง 16 บิตในการแทนตัวอักษรเนื่องจากที่มาของการคิดค้นรหัสชนิดนี้ คือ เมื่อมีการใช้งานคอมพิวเตอร์ในหลายประเทศและมีการสร้างแบบตัวอักษร (font) ของภาษาต่างๆ ทั่วโลก ในบางภาษาเช่น ภาษาจีน และภาษาญี่ปุ่น เป็นภาษาที่เรียกว่าภาษารูปภาพซึ่งมีตัวอักษรเป็น หมื่นตัว หากใช้รหัสที่เป็นเลขฐานสอง 8 บิต เราสามารถแทนรูปแบบตัวอักษรได้เพียง 256 รูปแบบที่ได้ อธิบายมาข้างต้น ซึ่งไม่สามารถแทนตัวอักษรได้ครบ จึงสร้างรหัสใหม่ขึ้นมาที่สามารถแทนตัวอักขระได้ถึง 65,536 ตัว ซึ่งมากพอและสามารถแทนสัญลักษณ์ กราฟิกและสัญลักษณ์ทางคณิตศาสตร์ได้อีกด้วย
2.3.3 การจัดเก็บข้อมูลในหน่วยความจํา
หน่วยความจําหลักของคอมพิวเตอร์เป็นที่เก็บข้อมูลและคําสั่งในขณะประมวลผล การเก็บข้อมูล ในหน่วยความจําเป็นการเก็บรหัสตัวเลขฐานสอง ข้อมูลที่ใช้ในการประมวลผลทั้งตัวเลขหรือตัวอักขระจะ ได้รับการแทนเป็นตัวเลขฐานสอง แล้วเก็บไว้ในหน่วยความจํา เช่น ข้อความว่า BANGKOK เก็บใน คอมพิวเตอร์จะแทนเป็นรหัสเรียงกันไป ดังนี
รูปที่ 2.5 การแทนข้อมูลด้วยรหัสเลขฐานสองในหน่วยความจำ
2.3.4 การจัดเก็บคําสั่งในหน่วยความจํา
ในการทํางานของเครื่องคอมพิวเตอร์ นอกจากข้อมูลแล้วสิ่งสําคัญอีกอย่างที่ทําให้เครื่อง คอมพิวเตอร์สามารถดําเนินการต่างๆ ตามที่เราต้องการได้คือชุดคําสั่ง โดยหน่วยควบคุมของคอมพิวเตอร์ที่ อยู่ในหน่วยประมวลผลกลาง (Central Processing Unit : CPU) หรือที่เรียกกันทั่วไปว่าซีพียูทําการอ่าน คําสั่งจากหน่วยความจํามาแปลความหมาย และกระทําตามคําสั่งการแปลความหมายคําสั่ง หมายถึงการ นําคําสั่งซึ่งเขียนขึ้นด้วยภาษาคอมพิวเตอร์ภาษาใดภาษาหนึ่งมาแปลงให้เป็นภาษาคอมพิวเตอร์ ระดับพื้นฐานที่เรียกว่า ภาษาเครื่อง(machine language) ซึ่งมีลักษณะเป็นรหัสเลขฐานสอง คอมพิวเตอร์ เครื่องหนึ่งมีคําสั่งที่ใช้ได้หลายร้อยคําสั่ง แต่ละคําสั่งจะมีความหมายเฉพาะ เช่น คําสั่งนําข้อมูลที่มีค่าเป็น 3 จากหน่วยความจําตําแหน่งที่ 8000 มาบวกกับข้อมูลที่มีค่าเป็น 5 ในตําแหน่งที่ 8001 ผลลัพธ์ที่ได้ให้เก็บ ไว้ในหน่วยความจําตําแหน่งที่ 8002 เมื่อเขี ยนคําสั่งเป็นภาษาเครื่องจะมีลั กษณะเป็น เลขฐานสองเรียงต่อ กันเป็นจํานวนมาก ซึ่งเข้าใจได้ยากจึงมักใช้ตัวอักษรแทนรหัสภาษาเครื่องเหล่านี้ ดังตัวอย่างแสดงในรูป 2.6
รูปที่ 2.5 แสดงตัวอย่างการแทนคำสั่งภาษาเครื่อง
รหัสภาษาเครื่องเมื่อเก็บอยู่ ในหน่วยความจําของคอมพิวเตอร์ จะมีลักษณะเรียงต่อกันไป สมมติให้ส่วน ของคําสั่งเก็บในหน่วยความจําเริ่มจากตําแหน่ง 1000 และส่วนของข้อมูลเก็บไว้เริ่มจากตําแหน่ง 8000 ดังรูปที่ 2.6 ภาษาเครื่องเป็นภาษาสั่งการพื้นฐานที่ใช้รหัสตัวเลขฐานสอง คอมพิวเตอร์ ที่ใช้หน่วยประมวลผลกลาง ต่างตระกูลกันจะมีภาษาเครื่องที่แตกต่างกัน เช่น เครื่องที่ใช้ซีพียูเพนเทียม(Pentium) กับซีพียูที่ใช้ในเครื่องแมก อินทอช มีรหัสคําสั่งต่างกัน
เนื้อหาจากโรงเรียนมหิดลวิทยานุสรณ์และกลุ่มโรงเรียนจุฬาภรณราชวิทยาลัย