Σύμφωνα με τη Διεθνή Ένωση Τηλεπικοινωνιών, στοΤο 2016, το Διαδίκτυο με μια ορισμένη κανονικότητα απολάμβανε τρία εκατομμύρια ανθρώπους. Οι περισσότεροι από αυτούς δεν σκέφτονται ακόμη και ότι τυχόν μηνύματα που αποστέλλονται σε αυτούς μέσω ενός υπολογιστή ή κινητές συσκευές, καθώς και τα κείμενα που εμφανίζονται στις οθόνες όλων των ειδών, στην πραγματικότητα, είναι ένας συνδυασμός από 0 και 1. Αυτό ονομάζεται η κωδικοποιημένη αναπαράσταση των πληροφοριών. Παρέχει και διευκολύνει σε μεγάλο βαθμό την υλοποίηση της αποθήκευσης, επεξεργασίας και μετάδοσης του. Το 1963, αναπτύχθηκε η αμερικανική κωδικοποίηση της ASCII, η οποία αποτελεί το αντικείμενο αυτού του άρθρου.
Από την άποψη κάθε ηλεκτρονικού υπολογιστήΤο κείμενο του μηχανήματος είναι ένα σύνολο ατομικών χαρακτήρων. Περιλαμβάνουν όχι μόνο γράμματα, συμπεριλαμβανομένων κεφαλαίων, αλλά και σημεία στίξης, αριθμούς. Επιπλέον, χρησιμοποιούνται ειδικά σύμβολα "=", "&", "(" και διαστήματα.
Το σύνολο χαρακτήρων που συνθέτουν το κείμενο,ονομάζεται αλφάβητο, και ο αριθμός τους είναι η δύναμη (που δηλώνεται ως Ν). Για να το προσδιορίσετε, χρησιμοποιήστε την έκφραση N = 2 ^ b, όπου b είναι ο αριθμός των δυαδικών ψηφίων ή το βάρος πληροφοριών ενός συγκεκριμένου συμβόλου.
Αποδεικνύεται ότι ένα αλφάβητο με χωρητικότητα 256 χαρακτήρων σάς επιτρέπει να αναπαριστάτε όλα τα απαραίτητα σύμβολα.
Δεδομένου ότι το 256 είναι η 8η δύναμη των δύο, το βάρος κάθε συμβόλου είναι 8 bit.
Μία μονάδα 8 bit λέγεται 1 byte, επομένως είναι συνηθισμένο να λέμε ότι ο δυαδικός κώδικας οποιουδήποτε χαρακτήρα στο κείμενο που είναι αποθηκευμένος στον υπολογιστή καταλαμβάνει ένα byte μνήμης.
Οποιαδήποτε κείμενα εγγράφονται στη μνήμη ενός προσωπικούυπολογιστή με τη βοήθεια πλήκτρων του πληκτρολογίου στα οποία γράφονται αριθμοί, γράμματα, σημεία στίξης και άλλα σύμβολα. Στη μνήμη RAM, μεταδίδονται σε δυαδικό κώδικα, δηλαδή κάθε χαρακτήρας αντιστοιχεί στον συνήθη ανθρώπινο δεκαδικό κώδικα από 0 έως 255, ο οποίος αντιστοιχεί σε δυαδικό κώδικα - από 00000000 έως 11111111.
Επιτρέπει κωδικοποίηση χαρακτήρων byteο επεξεργαστής που εκτελεί την επεξεργασία του κειμένου, αποκτά πρόσβαση σε κάθε σύμβολο χωριστά. Ταυτόχρονα, 256 χαρακτήρες αρκούν για να αναπαριστούν πληροφορίες χαρακτήρα.
Αυτή η συντομογραφία στην αγγλική γλώσσα σημαίνει αμερικανικό πρότυπο κώδικα για την ανταλλαγή πληροφοριών.
Κατά την αυγή της μηχανοργάνωσης, έγινε φανερό ότιμπορείτε να βρείτε μια μεγάλη ποικιλία τρόπων κωδικοποίησης πληροφοριών. Ωστόσο, για να μεταφέρονται πληροφορίες από έναν υπολογιστή σε άλλο, έπρεπε να αναπτυχθεί ένα ενιαίο πρότυπο. Έτσι, το 1963 στις ΗΠΑ υπήρχε ένας πίνακας κωδικοποίησης ASCII. Σε αυτό, κάθε σύμβολο του αλφαβήτου υπολογιστή έχει εκχωρηθεί ο αύξων αριθμός του στη δυαδική αναπαράσταση. Αρχικά, η κωδικοποίηση ASCII χρησιμοποιήθηκε μόνο στις Ηνωμένες Πολιτείες και στη συνέχεια έγινε το διεθνές πρότυπο για τον υπολογιστή.
Οι κώδικες ASCII χωρίζονται σε 2 μέρη. Το διεθνές πρότυπο είναι μόνο το πρώτο μισό αυτού του πίνακα. Περιλαμβάνει σύμβολα με αριθμούς από 0 (κωδικοποιημένο ως 00000000) έως 127 (κωδικός 01111111).
Αριθμός ακολουθίας Ν | Κωδικοποίηση κειμένου ASCII | Σύμβολο |
0 - 31 | 0000 0000 - 0001 1111 | Τα σύμβολα με Ν από 0 έως 31 καλούνται διαχειριστές. Η λειτουργία τους είναι να "καθοδηγούν" τη διαδικασία εκτύπωσης κειμένου σε μια οθόνη ή μια συσκευή εκτύπωσης, δίνοντας ένα ηχητικό σήμα κ.λπ. |
32 - 127 | 0010 0000 - 0111 1111 | Σύμβολα με Ν από 32 έως 127 (το κανονικό μέροςπίνακες) - κεφαλαία και πεζά γράμματα του λατινικού αλφαβήτου, 10 ψηφία, σημεία στίξης, καθώς και διάφορες αγκύλες, εμπορικά και άλλα σύμβολα. Το σύμβολο 32 δηλώνει ένα χώρο. |
128 - 255 | 1000 0000 - 1111 1111 | Σύμβολα με Ν από 128 έως 255 (εναλλακτικό μέροςπίνακες ή σελίδα κώδικα) μπορούν να έχουν διαφορετικές παραλλαγές, κάθε μία από τις οποίες έχει τον δικό της αριθμό. Η σελίδα κώδικα χρησιμοποιείται για τον προσδιορισμό των εθνικών αλφαβήτων, τα οποία διαφέρουν από τα λατινικά. Συγκεκριμένα, είναι με τη βοήθειά του ότι το ASCII κωδικοποιείται για Ρώσους χαρακτήρες. |
Στον πίνακα κωδικοποίησης, κεφαλαία και πεζά γράμματα ακολουθούν αλφαβητικά, και οι αριθμοί είναι σε αύξουσα σειρά. Αυτή η αρχή διατηρείται επίσης για το ρωσικό αλφάβητο.
Ο αρχικός πίνακας κωδικοποίησης ASCII δημιουργήθηκε αρχικάγια τη λήψη και τη μετάδοση πληροφοριών σε μια συσκευή που δεν έχει χρησιμοποιηθεί για μεγάλο χρονικό διάστημα, όπως ένα teletype. Από την άποψη αυτή, η μη εκτύπωση, που χρησιμοποιήθηκε ως εντολές για τον έλεγχο αυτής της συσκευής, συμπεριλήφθηκε στο σύνολο χαρακτήρων. Παρόμοιες εντολές χρησιμοποιήθηκαν σε τέτοιες μεθόδους μηνυμάτων προ-υπολογιστών όπως ο κώδικας Morse κλπ.
Το σύνηθες σύμβολο "teletype" είναι NUL (00, "μηδέν"). Χρησιμοποιείται ακόμα στις περισσότερες γλώσσες προγραμματισμού, που υποδηλώνουν το τέλος της γραμμής χαρακτήρα.
Ο αμερικανικός τυποποιημένος κώδικας απαιτείται όχι μόνογια να εισαγάγετε πληροφορίες κειμένου από το πληκτρολόγιο. Χρησιμοποιείται επίσης στα γραφικά. Ειδικότερα, στο πρόγραμμα ASCII Art Maker, εικόνες διαφόρων επεκτάσεων αντιπροσωπεύουν μια σειρά συμβόλων χαρακτήρων ASCII.
Παρόμοια προϊόντα έχουν δύο τύπους: λειτουργίας λειτουργία με τη μετατροπή της επεξεργασίας εικόνας εικόνα, το κείμενο και μετατρέπει τις «εικόνες» στο ASCII-χρονοδιάγραμμα. Για παράδειγμα, ένα γνωστό χαμόγελο είναι ένα ζωντανό παράδειγμα ενός συμβόλου κωδικοποίησης.
Το ASCII μπορεί επίσης να χρησιμοποιηθεί κατά τη δημιουργία ενός εγγράφου HTML. Σε αυτήν την περίπτωση, μπορείτε να εισαγάγετε ένα συγκεκριμένο σύνολο χαρακτήρων και όταν προβάλετε τη σελίδα, στην οθόνη εμφανίζεται ένα σύμβολο που αντιστοιχεί σε αυτόν τον κωδικό.
Το ASCII απαιτείται επίσης για τη δημιουργία πολύγλωσσων τοποθεσιών, δεδομένου ότι οι χαρακτήρες που δεν αποτελούν μέρος συγκεκριμένου εθνικού πίνακα αντικαθίστανται από τους κωδικούς ASCII.
Για την κωδικοποίηση των πληροφοριών κειμένου σε ASCII κωδικοποίηση, αρχικά χρησιμοποιήθηκαν 7 bits (ένα ήταν κενό), αλλά σήμερα λειτουργεί ως ένα 8-bit.
Τα γράμματα που βρίσκονται στις στήλες στο επάνω και στο κάτω μέρος διαφέρουν μεταξύ τους μόνο με ένα μόνο bit. Αυτό μειώνει σημαντικά την πολυπλοκότητα της επαλήθευσης.
Εάν είναι απαραίτητο, αυτός ο τύπος κωδικοποίησης κειμένουοι πληροφορίες μπορούν να χρησιμοποιηθούν στους επεξεργαστές κειμένου της Microsoft, όπως το Notepad και το Office Word. Ωστόσο, κατά την πληκτρολόγηση, στην περίπτωση αυτή θα είναι αδύνατη η χρήση ορισμένων λειτουργιών. Για παράδειγμα, δεν μπορείτε να εκτελέσετε έντονη γραφή, αφού η κωδικοποίηση ASCII διατηρεί μόνο την έννοια των πληροφοριών, αγνοώντας τη γενική εμφάνιση και τη μορφή της.
Το ISO έχει υιοθετήσει τα πρότυπα ISO 8859. Αυτή η ομάδα ορίζει κωδικοποιήσεις οκτώ δυαδικών ψηφίων για διαφορετικές ομάδες γλωσσών. Ειδικότερα, το πρότυπο ISO 8859-1 είναι Extended ASCII, το οποίο αποτελεί πίνακα για τις Ηνωμένες Πολιτείες και τις χώρες της Δυτικής Ευρώπης. Και το ISO 8859-5 είναι ένας πίνακας που χρησιμοποιείται για την κυριλλική γλώσσα, συμπεριλαμβανομένων των ρωσικών.
Για διάφορους ιστορικούς λόγους, το πρότυπο ISO 8859-5 δεν χρησιμοποιήθηκε πολύ.
Για τη ρωσική γλώσσα αυτή τη στιγμή, η κωδικοποίηση χρησιμοποιείται πραγματικά:
Το κύριο πλεονέκτημα του πρώτου προτύπου CP866ήταν η διατήρηση των ψευδο-γραφικών συμβόλων στις ίδιες θέσεις όπως στην Extended ASCII. Αυτό επέτρεψε να τρέξετε αμετάβλητα προγράμματα κειμένου, ξένη παραγωγή, όπως ο διάσημος Norton Commander. Προς το παρόν, το CP866 χρησιμοποιείται για προγράμματα που αναπτύσσονται στα Windows που λειτουργούν σε λειτουργία πλήρους οθόνης ή σε παράθυρα κειμένου, συμπεριλαμβανομένου του FAR Manager.
Τα ηλεκτρονικά κείμενα, γραμμένα στην κωδικοποίηση CP866, ήταν πρόσφατα σπάνια, αλλά χρησιμοποιούνται για ρωσικά ονόματα αρχείων στο "Vindous".
Επί του παρόντος, το πιο διαδεδομένοέλαβε αυτή τη συγκεκριμένη κωδικοποίηση. Οι κωδικοί Unicode χωρίζονται σε περιοχές. Το πρώτο (από U + 0000 έως U + 007F) περιλαμβάνει τους χαρακτήρες του συνόλου ASCII με κωδικούς. Στη συνέχεια, ακολουθήστε τις περιοχές σημείων διαφόρων εθνικών σεναρίων, καθώς και σημεία στίξης και τεχνικά σύμβολα. Επιπλέον, μέρος των κωδικών Unicode διατηρείται σε περίπτωση που υπάρχει ανάγκη να συμπεριληφθούν νέα σύμβολα στο μέλλον.
Τώρα ξέρετε ότι στην κωδικοποίηση ASCII, το καθένατο σύμβολο αντιπροσωπεύεται ως συνδυασμός 8 μηδέν και αυτών. Για τους μη ειδικούς, οι πληροφορίες αυτές μπορεί να φαίνονται περιττές και αδιάφορες, αλλά δεν θέλετε να μάθετε τι συμβαίνει στο "μυαλό" του υπολογιστή σας!
</ p>