[successivo] [precedente] [inizio] [fine] [indice generale] [indice ridotto] [translators] [docinfo] [indice analitico] [volume] [parte]
I codici a barre sono dati memorizzati in forma ottica, attraverso l'uso di barre verticali che possono essere lette e interpretate facilmente con strumenti non troppo complessi. La tecnica dei codici a barre nasce negli anni 1960 e si diffonde negli anni 1970, con lo scopo di identificare rapidamente imballaggi e merci.
Gli standard sui codici a barre sono molti e il problema più importante da risolvere quando si vogliono usare è il decidere quale sia quello più conveniente per i propri fini. Si parla di simbologia per fare riferimento al tipo di codice a barre, ovvero allo standard di rappresentazione dei dati; la simbologia definisce implicitamente il tipo di dati che possono essere memorizzati. Per fare un esempio abbastanza comune, i codici ISBN dei libri sono scritti usando codici a barre di tipo EAN-13, che si compongono di 13 cifre numeriche; in questo caso, la simbologia è EAN-13, con la quale si vanno a rappresentare in pratica i codici ISBN.
Le rappresentazioni normali di un codice a barre sono a una sola dimensione, ovvero, è prevista una lettura orizzontale unica. Nella lettura vengono attraversate barre verticali nere e spazi bianchi; queste barre di larghezze differenti e gli spazi di ampiezze diverse sono gli elementi della simbologia; ogni simbologia usa un proprio numero di elementi differenti. Nel capitolo vengono descritte brevemente alcune simbologie standard.
Alcuni tipi di codici numerici utilizzano un numero di controllo (o codice di controllo) per permettere una verifica facile dell'integrità del dato rappresentato. Esiste un genere comune di algoritmi per il calcolo di tali numeri di controllo, a cui si fa spesso riferimento con la definizione modulo n, dove n è un numero intero maggiore di uno.
In questo modo si fa riferimento a una somma di valori, ottenuta moltiplicando ogni cifra del numero di partenza, compreso il numero di controllo, per un certo peso (un altro numero intero positivo), che deve essere un multiplo del numero n stabilito. Si osservi l'esempio seguente, in cui il numero di controllo finale è calcolato con i pesi dati, dividendo per il modulo 5:
|
5 + 12 + 15 + 14 + 4 = 50
50 è divisibile perfettamente per cinque, senza lasciare resti, garantendo l'integrità del valore.
In pratica, il peso che si dà al valore da usare come numero di controllo è solitamente uno, per cui diventa facile il calcolo di questa cifra:
5 + 12 + 15 + 14 = 46;
46 / 5 = 9, con il resto di 1;
5 - 1 = 4, ovvero il valore cercato come numero di controllo.
UPC è un insieme di simbologie standard utilizzato in particolare negli Stati Uniti e nel Canada. Con UPC-E e UPC-A si possono rappresentare solo cifre numeriche: UPC-A consente di rappresentare 11 cifre più una di controllo; UPC-E consente di rappresentare sei cifre, senza codice di controllo (il controllo di integrità avviene in forma differente).
La figura 629.2 mostra rispettivamente l'esempio di 123 456 con UPC-E e di 12 345 678 901 con UPC-A.
|
Gli elementi utilizzati nella simbologia UPC sono otto, composti da quattro tipi di barre nere e quattro tipi di spazi.
Il codice di controllo di UPC-A si calcola moltiplicando in modo alterno le cifre che compongono il numero, per tre, o per uno, sommando alla fine i risultati. Ciò che si ottiene si divide per 10 e si tiene il resto; infine, 10 meno il resto ottenuto dà il codice di controllo cercato (modulo 10). Per esempio, nel caso di 12 345 678 901 si ottiene il codice di controllo due, in base al calcolo seguente:
|
Il totale che si ottiene è 98; pertanto: 98/10 = 9 con un resto di 8; 10-8 = 2.
EAN (European article number) è un insieme di simbologie standard di origine europea, utilizzato anche in altri paesi, nato come estensione delle simbologie UPC.
EAN-8 e EAN-13 permettono di rappresentare solo cifre numeriche: EAN-8 consente di rappresentare sette cifre più una di controllo, mentre EAN-13 consente di rappresentare 12 cifre numeriche più una di controllo.
La figura 629.4 mostra rispettivamente l'esempio di 1 234 567 con EAN-8 e di 123 456 789 012 con EAN-13.
|
Il codice di controllo di EAN-8 e di EAN-13 si calcola nello stesso modo di UPC-A. Per esempio, nel caso di 1 234 567 (EAN-8) si ottiene il codice di controllo zero, mentre nel caso di 123 456 789 012 (EAN-13) si ottiene otto.
|
Il totale che si ottiene è 60; pertanto: 60/10 = 6 con un resto di 0; 10-0 = 10, da cui si prende solo l'ultima cifra (lo zero).
|
Il totale che si ottiene è 92; pertanto: 92/10 = 9 con un resto di 2; 10-2 = 8.
La rappresentazione di ogni cifra numerica può avere tre forme differenti, a cui si attribuisce convenzionalmente una lettera alfabetica maiuscola: A, B e C. Nella simbologia EAN-8, le prime quattro cifre sono rappresentate secondo la forma A, mentre le ultime quattro secondo la forma C. Invece, la rappresentazione delle cifre nella simbologia EAN-13 è più complessa, per l'esigenza di essere compatibile con UPC-A.
Con EAN-13 si rappresentano effettivamente solo le ultime 12 cifre (incluso il codice di controllo), mentre la prima viene determinata in base al modo in cui vengono rappresentate le sei cifre successive. In pratica, a seconda del valore della prima cifra, si determina la combinazione delle forme A e B, per le sei cifre che seguono la prima, mentre le ultime sei sono rappresentate con la forma C.
|
Dallo specchietto si può notare che con una prima cifra pari a zero, le sei cifre successive si rappresentano secondo la forma A, esattamente come avviene nella simbologia UPC-A. In pratica, a parte qualche differenza estetica minima, un codice a barre realizzato con la simbologia EAN-13 è uguale a un altro realizzato con la simbologia UPC-A, quando la prima cifra è pari a zero, tenendo conto che lo zero iniziale non può cambiare nulla anche nel calcolo del codice di controllo finale.
In generale, la simbologia EAN-13 viene utilizzata per identificare degli «articoli», intesi principalmente come prodotti in vendita. Per poter applicare un codice a barre del genere occorre naturalmente avere ottenuto il numero per uno scopo preciso (l'ente italiano competente per l'attribuzione dei codici EAN è Indicod); tuttavia esiste un prefisso iniziale che fa parte dello standard e serve a stabilire l'origine del codice. l'origine è un concetto riferito precisamente a chi ha rilasciato il numero, che nella maggior parte dei casi si riferisce a un'organizzazione con competenza nazionale.
Questo prefisso iniziale dipende principalmente da due organizzazioni: UCC (Uniform code council) ed EAN (European article number). La prima organizzazione, definisce codici in cui la prima cifra identifica l'origine nell'area nell'ambito di Stati Uniti e Canada, mentre la seconda copre tutto il mondo, includendo la codifica UCC a cui si aggiunge la cifra iniziale zero.
La tabella 629.8 mostra in pratica un elenco abbastanza completo dei prefissi EAN, che solitamente si applicano ai codici a barre con simbologia EAN-13. Si può osservare che ormai i codici assegnati all'area Stati Uniti e Canada non hanno più solo lo zero iniziale; resta comunque l'abbinamento tra codice UCC e codice EAN, per cui il primo si trasforma nel secondo aggiungendo uno zero iniziale.
|
Si può osservare in particolare che il prefissi 978 e 979 sono riservati per i libri, mentre il prefisso 977 è riservato per i periodici (riviste). Dal momento che il prefisso EAN definiva originariamente un'area nazionale, è stata attribuita al codice 978 la denominazione bookland (la terra dei libri). Molta documentazione sui codici a barre e sulla numerazione ISBN fa ancora riferimento a questo nome per indicare tale prefisso.
Un altro prefisso interessante è il due, che rimane libero. Molti negozi usano codici a barre EAN-13, con prefisso due per annotare il prezzo di qualcosa che non è identificabile diversamente, come gli alimentari ottenuti da un banco di salumi e formaggi. La figura 629.9 mostra un esempio reale in cui, tra le altre cose, si annota un prezzo di 11,24 €.
|
La simbologia EAN-13 viene usata in diverse situazioni comuni, in particolare per ciò che riguarda le pubblicazioni.
La codifica ISBN (International standard book number) permette di identificare un libro in una sua edizione precisa, attraverso un numero composto da 10 cifre. Il numero in questione contiene quattro parti: l'origine (ovvero l'ente che lo ha rilasciato), l'editore, il titolo (il libro) e un numero di controllo finale (una sola cifra).
Per facilitare la lettura di queste informazioni, le quattro parti vengono mostrate solitamente come separate, attraverso un trattino. Per esempio, 88-8331-223-6 indica l'origine 88 (Italia), l'editore 8 331, il titolo 233 e il numero di controllo 6.
Le varie parti in cui si suddivide l'informazione contenuta in un numero ISBN non sono di lunghezza fissa e la dimensione dell'una limita quella delle altre. In generale sono disponibili i raggruppamenti seguenti.
La prima parte identifica l'area (nazionale, linguistica e geografica) e viene attribuita dall'agenzia internazionale dell'ISBN. Il numero assegnato all'Italia è 88.
0-7
80-94
950-994
9 950-9 989
99 900-99 999
La seconda parte identifica l'editore e viene attribuito dall'agenzia ISBN competente nell'area di riferimento.
00-19
200-699
7 000-8 499
85 000-89 999
900 000-999 999
La terza parte identifica il titolo, relativamente all'editore a cui si fa riferimento, utilizzando lo spazio rimanente, escludendo il numero di controllo finale.
Il numero di controllo viene calcolato moltiplicando le cifre per un numero che va da 10 a uno, sommando ciò che si ottiene e dividendo per il «modulo 11». In questo modo, il valore che si ottiene può andare da 0 a 10, dove il 10 si rappresenta con una lettera «X».
Per comprendere il meccanismo del calcolo del numero di controllo, conviene vedere un esempio reale, il numero ISBN 88-8331-223-6. In pratica, si tratta di verificare che il numero sei sia effettivamente il numero di controllo corretto.
|
Il totale che si ottiene è 286, che diviso per 11 dà esattamente 26, senza resto, a conferma della validità del numero di controllo. Non conoscendo il numero di controllo lo si potrebbe calcolare: la somma che si otterrebbe sarebbe solo 280, che divisa per 11 dà 25 con il resto di 5, per cui, 11 - 5 dà 6, il numero cercato.
Il numero ISBN si trasforma in EAN-13 mettendo anteriormente il valore 978 e togliendo il numero di controllo finale che va sostituito con quello calcolato secondo lo standard EAN-13; naturalmente, i trattini di divisione sono perduti. La figura 629.11 mostra l'esempio del codice ISBN 88-481-0113-5 rappresentato secondo la simbologia EAN-13, che si trasforma nel numero 9 788 848 101 134.
|
A seconda del paese in cui si utilizza il numero ISBN, può essere obbligatorio o meno un codice a barre aggiuntivo contenente l'informazione sul prezzo.
La codifica ISSN permette di identificare una pubblicazione periodica attraverso una tecnica simile a quella del numero ISBN per i libri. In questo caso, il numero è composto da otto cifre numeriche (compreso il numero di controllo), che vanno inserite in una simbologia EAN-13 aggiungendo all'inizio il prefisso 977, togliendo il numero di controllo ISSN, aggiungendo due cifre che rappresentano il codice del prezzo e aggiungendo il codice di controllo EAN-13. Inoltre, va aggiunto un codice a barre ulteriore per rappresentare due o cinque cifre in cui si indica il numero del fascicolo.
Per esempio, il numero ISSN 1129-1346 di una rivista potrebbe tradursi nel codice a barre 9 771 129 134 006, con l'aggiunta di 10 110, dove il codice del prezzo è assente e si fa riferimento al fascicolo numero 110.
La figura 629.12 mostra l'esempio del codice di due riviste, in cui appare anche un'estensione contenente il numero della pubblicazione.
|
La simbologia denominata Code 39, ovvero 3 of 9, consente di rappresentare 42 simboli, composti da lettere maiuscole, cifre numeriche e pochi altri segni. La tabella 629.13 riepiloga l'insieme di caratteri. Un codice a barre Code 39 è composto da un carattere di inizio, dai dati che deve contenere, da un codice di controllo (che non appare tradotto per la lettura umana) e dal carattere di fine. Il carattere usato per iniziare e per concludere la sequenza è l'asterisco, che quindi non può essere utilizzato nei dati contenuti.
|
|
Gli elementi utilizzati nella simbologia Code 39 sono quattro, composti da due tipi di barre nere e due tipi di spazi. Ogni carattere o segno che può essere rappresentato con questa simbologia, si avvale di cinque barre e di quattro spazi, per un totale di nove elementi. Il nome della simbologia, che si può tradurre come «tre su nove», indica il fatto che tre elementi su nove sono sempre di tipo largo (rispetto agli altri che invece sono stretti).
Il codice di controllo si ottiene sommando assieme i valori abbinati ai segni che si possono rappresentare, secondo la tabella di conversione 629.13, dividendo per 43. Il resto della divisione è il codice di controllo. Nel caso dell'esempio che appare in figura 629.14, si tratta della lettera L:
«CIAO» = 12 + 18 + 10 + 24 = 64
64 / 43 = 1 lasciando un resto di 21 = L
Esiste anche un'estensione della simbologia Code 39, allo scopo di consentire la rappresentazione dell'ASCII standard completo. Si ottiene questo risultato scrivendo due simboli normali al posto di uno. Naturalmente, dal momento che non esiste un modo per distinguere la codifica standard da quella estesa, è necessario che il lettore di codice a barre sia impostato nel modo più conveniente. La tabella 629.15 mostra l'insieme di caratteri esteso e la corrispondenza con i segni della simbologia Code 39 normale.
La simbologia denominata Code 128, ovvero USS Code 128, consente di rappresentare 106 simboli, che possono essere interpretati secondo tre insiemi di caratteri, distinti in base a una lettera: A, B e C. Per questa ragione, un codice a barre realizzato secondo la simbologia Code 128 inizia sempre con la dichiarazione dell'insieme di caratteri. L'informazione non ha una lunghezza predeterminata e può essere modificato l'insieme di caratteri quando serve. La simbologia Code 128 prevede l'inserimento di un codice di controllo, calcolato automaticamente per consentire la verifica della lettura meccanica, ma questa cifra non viene mostrata per la lettura umana.
|
Gli insiemi di caratteri A, B e C sono elencati nella tabella 629.16. Come si può vedere, l'insieme A consente di rappresentare l'alfabeto maiuscolo, le cifre numeriche, vari simboli di punteggiatura e caratteri di controllo; in pratica, ciò che si può rappresentare con la prima parte della codifica ASCII, tenendo conto che le posizioni non corrispondono. L'insieme B consente di rappresentare praticamente tutto l'alfabeto ASCII, compresa la distinzione tra lettere maiuscole e minuscole, a esclusione dei caratteri di controllo. L'insieme C consente di rappresentare valori numerici a coppie, per cui, un valore composto da un numero dispari di cifre acquisisce uno zero iniziale.
|
La figura 629.17 mostra la comparazione tra un codice a barre realizzato usando l'insieme B e un altro con l'insieme C. L'informazione contenuta è la stessa dal punto di vista dei valori rappresentabili (eventualmente si osservino le tabelle degli insiemi di caratteri). Se fosse possibile sovrapporre i due codici, si noterebbe che cambia solo la parte iniziale, quella in cui si dichiara l'insieme di caratteri, e la parte finale, dove si inserisce il codice di controllo. Si può anche osservare che gli ultimi elementi rimangono uguali e sono quelli che contengono il codice di conclusione.
Volendo entrare nel dettaglio, l'esempio di figura 629.17 si compone di: Start B, 35, 73, 65, 79, codice_di_controllo, Stop; ovvero, nel secondo caso, Start C, 35, 73, 65, 79, codice_di_controllo, Stop.
Quando si vuole cambiare l'insieme di caratteri, si inserisce un simbolo Code A, Code B o Code C, per introdurre l'insieme a cui si vuole fare riferimento da quel punto in poi.
Il codice di controllo finale si calcola sommando il valore corrispondente alla dichiarazione iniziale dell'insieme di caratteri alla somma dei valori successivi, moltiplicati per la loro posizione. La somma complessiva va divisa per 103 e il resto che si ottiene è il codice di controllo finale. Si osservi l'esempio:
|
Pertanto:
104 + 35 + 146 + 195 + 316 = 796
796 / 103 = 7 con resto di 75. Il codice di controllo è il simbolo corrispondente al valore 75.
Usando l'insieme di caratteri C la cosa cambia, perché il simbolo iniziale ha il valore 105, per cui il codice di controllo finale è 76:
|
Dalla simbologia Code 128 derivano diverse applicazioni speciali che si distinguono per avere una struttura particolare. Esiste anche una variante che consente la rappresentazione di più caratteri rispetto all'ASCII standard.
La simbologia UCC/EAN 128 è un'applicazione di Code 128, in cui si inizia dichiarando l'insieme di caratteri e si inserisce subito dopo il simbolo FNC 1 (Function code one).(1)
Dopo il simbolo FNC 1 viene indicato un codice che indica il tipo di applicazione. Si fa riferimento a questo con la sigla AI (Application identifier). L'informazione in questione viene rappresentata per la lettura umana tra parentesi tonde, proprio per facilitare l'interpretazione, a sottolineare il fatto che si tratta di un prefisso. Naturalmente, l'informazione può essere anche più complessa e altre parti dei dati successivi possono essere separate ed evidenziate nello stesso modo o in modi differenti.
La simbologia ITF, o i25, nota come Interleaved two of five, ovvero «interfogliata due su cinque», consente la rappresentazione di soli valori numerici, di lunghezza indefinita, purché in numero di cifre pari. La simbologia prevede una cifra di controllo finale, opzionale.
La simbologia si compone di due tipi di barre e due tipi di spazi. Ogni simbolo si rappresenta con cinque barre e cinque spazi, dove due barre su cinque e due spazi su cinque sono più larghi. La simbologia è detta «interfogliata», perché una cifra è codificata nelle barre e la successiva lo è negli spazi che separano gli elementi del carattere precedente. Prima dei dati è previsto un simbolo iniziale, composto da una barra sottile, uno spazio breve, una barra sottile e un altro spazio breve; alla fine c'è un simbolo finale, composto da una barra larga, uno spazio sottile e una barra sottile.
|
Il codice a barre comune è a una sola dimensione, nel senso che contiene una sola riga di informazioni, eventualmente anche molto breve. Semplificando le cose, si può dire che quando si sovrappongono più righe in un codice a barre, questo diventa a due dimensioni.
Un sistema di codice a barre a due dimensioni, con lo scopo di memorizzare dati, deve essere organizzato in modo da permettere al lettore meccanico di riconoscere e seguire le righe; inoltre deve essere previsto un sistema di informazioni ridondanti, anche molto complesso, in modo da garantire la lettura in presenza di errori.
Lo standard più comune per i codici a barre a due dimensioni è il PDF417, che comunque qui non viene descritto.
EAN international
The EAN·UCC system
Tino Hempel, Die Europäische Artikelnummer (EAN)
Barcoding for Beginners & Bar Code FAQ
Code 39 Barcode FAQ and Tutorial
Code 128 / USS Code-128 Barcode FAQ & Tutorial
PDF417 Barcode FAQ
UPC / EAN Barcode Font Data Sheet
PDF417
Russ Adams, Barcode 1
International ISBN Agency: Coordinator of the International Standard Book Number system
International ISBN Agency, The ISBN Users' Manual
<http://www.isbn.org/standards/home/isbn/International/ISBNmanual.asp>
AIE - Agenzia ISBN
Appunti di informatica libera 2006.07.01 --- Copyright © 2000-2006 Daniele Giacomini -- <daniele (ad) swlibero·org>
1) L'uso comune è dell'insieme di caratteri C, ma ciò non è imposto dallo standard.
Dovrebbe essere possibile fare riferimento a questa pagina anche con il nome codici_a_barre.htm
[successivo] [precedente] [inizio] [fine] [indice generale] [indice ridotto] [translators] [docinfo] [indice analitico]