| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • Work with all your cloud files (Drive, Dropbox, and Slack and Gmail attachments) and documents (Google Docs, Sheets, and Notion) in one place. Try Dokkio (from the makers of PBworks) for free. Now available on the web, Mac, Windows, and as a Chrome extension!

View
 

Corso di informatica - Codifica segnali

Page history last edited by Trapani Marco 12 years, 10 months ago
  • Rappresentazione dei segnali audio

    La rappresentazione dei segnali audio richiede due passi: il campionamento dei segnali e la quantizzazione.

    • Campionamento. Il campionamento consiste nella estrazione di un insieme di campioni da un segnale continuo. Usualmente i campioni sono equispaziati nel tempo ma non è una condizione necessaria. Esiste un teorema, dovuto a Nyquist, che stabilisce la frequenza minima alla quale bisogna campionare un segnale per essere sicuri di non perdere informazione. Questo teorema si rifà alla descrizione di un segnale in termini delle frequenze che lo compongono. Una comprensione completa di questo concetto richiederebbe la nozione di trasformata di Fourier. Ci limitiamo qui a dire che in virtù della teoria di Fourier, qualsiasi segnale è scomponibile in una varietà di componenti che sono delle semplici oscillazioni costanti, ognuna caratterizzata da una ben precisa frequenza di oscillazione. Nella realtà i segnali sono sempre caratterizzati da una frequenza massima. Il teorema di Nyquist dice che la frequenza minima alla quale un segnale deve essere campionato per non perdere informazione è pari al doppio della massima frequenza presente nel segnale.
    • Quantizzazione. Ogni valore campionato deve essere trasformato in un numero digitale. Questo è un processo che prende il nome di conversione analogico-digitale ed è svolto da un componente che prende il nome di ADC (Analog to Digital Converter).

 

  • Rappresentazione delle immagini

    Le immagini digitali sono sempre formate da una sorta di scacchiera di piccoli quadratini denominati pixel , il cui interno è rappresentato con un colore uniforme al quale nel computer corrisponde un certo valore numerico. Per esempio in un'immagine TAC (Tomografia Assiale Computerizzata) ogni pixel è rappresentato con una certa intensità di grigio alla quale corrisponde un numero che rappresenta (con una certa approssimazione) la densità dei tessuti in quel pixel.

    I concetti visti per i segnali audio, che sono segnali monodimensionali, si applicano pari pari alle immagini che sono segnali bidimensionali. Le considerazini fatte per i segnali audio valgono quindi per ciascuna delle due dimensioni che compongono un'immagine.

    • Formato bitmap: viene memorizzato il contenuto di ogni pixel congelando in un certo senso l'immagine. Può succedere che rappresentando o stampando l'immagine su sistemi diversi questa appaia in modo diverso.

      Riportiamo le sigle di alcuni dei più diffusi formati

      TIFF Tagged Image File Format
      GIF Graphics Iterchange Format (Formato concepito per l'invio di immagini in rete)
      PNG Portable Network Graphics (Formato molto diffuso in rete, concepito come sostituto del GIF)
      JPEG Joint Photographers Experts Group (Per immagini fotografiche)
      BMP Bitmap (formato tipico di Windows)
      PCX PC Paintbrush (formato di questo vecchio programma Windows, ora sostituito da Paint)
      PICT Formato Macintosh (anche vettoriale)

      Le immagini mediche, quali per esempio quelle prodotte dalla TAC o dalla RM (Risonanza Magnetica) sono codificate in un formato tipo bitmap. Questo significa che molto semplicemente, per ogni pixel, viene memorizzato il contenuto in parole successive. Per esempio i contenuti dei pixel sono ordinati in parole successive seguendo lo stesso ordine con cui si leggono le parole di un testo: prima riga da sinistra a destra, seconda riga da sinistra a destra e così via. La dimensione in bit delle parole dipende dal contesto, diciamo che in generale, per immagini tipo TAC possono essere usate parole di 16 bit. Questo semplicissimo formato è quello che i sistemi di elaborazione utilizzano in fase di elaborazione delle immagini. Quando queste vengono archiviate allora vengono impiegate tecniche di compressione come quelle descritte nel seguito di questa sezione. Vengono usualmente preferite tecniche di compressione conservative che preservano completamente il contenuto di informazione perché la fruizione delle immagini comporta spesso qualche forma di elaborazione per le quali è importante che il contenuto di informazione sia completo. La più semplice elaborazione delle immagini è quella che consente di determinare istantaneamente la legge di rappresentazione dell'immagine. È una tecnica elementare dal punto di vista matematico ma è impiegata costantemente nell'analisi delle immagini al fine di poter visualizzare efficacemente tutti i particolari. Per chi è curioso di vedere gli effetti di questa tecnica (prima di attivare il link successivo leggete le note sull'uso delle applet e sui plugin) sono disponibili due pagine interattive che consentono di manipolare gli estremi di visualizzazione di un'immagine di risonanza magnetica. La prima è più ricca poiché mostra anche il grafico della legge di rappresentazione ma è probabilmente più lenta (su certi sistemi), la seconda è un po' più semplice ma è probabilmente più veloce.

    • Formato vettoriale: l'immagine viene costruita per oggetti semplici per ognuno dei quali vengono memorizzate le caratteristiche salienti. Per esempio le coordinate dei vertici di di un triangolo è una descrizione più astratta che consente di ottenere rappresentazioni di massima qualità su qualsiasi supporto di visualizzazione o stampa.

      È opportuno menzionare i seguenti formati

      PS PostScript (formato nato per la diffusione di immagini su sistemi Unix)
      EPS Encapsulated PostScript (postscript migliorato per facilitare l'inclusione nei documenti)
      PDF Portable Document Format (evoluzione del postscript che può includere collegamenti ipertestuali)
    • Compressione delle informazioni
      • Tecniche di compressione conservative

        Con queste tecniche l'infomazione compressa viene recuperata in maniera completa senza alcuna forma di degradazione. Le più note sono la codifica RLE (Run Legth Encoding) che sfrutta le ripetizioni di bytes uguali, la codifica LZW (Lempel Ziv Welch) che impiega le ripetizioni di stringhe di caratteri uguali e la codifica di Huffman che utilizza codici di rappresentazione più brevi per i caratteri che appaiono più frequentemente in un testo.

        I più popolari programmi di compressione quali WinZip utilizzano questo tipo di metodi.

        È evidente che il grado di compressione dipende dal contenuto dell'oggetto da comprimere. Se si tratta di un testo con molte ripetizioni il livello di compressione sarà maggiore. Per quanto riguarda le immagini, la presenza di larghe aree uniformi favorisce la compressione.

      • Tecniche di compressione non conservative

        Oggi vi è una grande necessità di trasmettere elevate quantità di informazioni. Trasmettere in rete files molto grandi significa amplificare i tempi di trasmissione. Questo problema ha stimolato lo sviluppo di tecniche di compressione ancora più potenti che sfruttano il fatto di poter assumere che una parte delle informazioni siano irrilevanti per l'utente finale. Queste tecniche si chiamano non conservative perché non consentono un recupero completo delle informazini originali. I segnali audio e le immagini sono esempi tipici di applicazione di tali metodi.

        • Il formato MP3

          La digitalizzazione dei segnali audio richiede l'impiego di una grande quantità di bytes. Per esempio un segnale audio può essere campionato in 44100 campioni/secondo ove ogni campione richiede 2 bytes (16 bits) ed usualmente vi sono 2 canali per la riproduzione stereo. Poiché lunghe sequenze si dati si trasformano in lunghi tempi di trasmissione sono molto importanti le tecniche di compressione. Nel mondo dei segnali audio è diventato mlto importante lo standard di compressione MP3. Si tratta di uno standard che agisce in modo differenziato sulle varie componenti in frequenza tenendo conto della sensibilità dell'orecchio alle diverse frequenze e trascurando componenti di ampiezza minore quando esse sono contemporanee ad altre frequenze caratterizzate da ampiezza molto maggiore. Con il formato MP3 si ottengono fattori di compressione compresi fra 10 e 14. Si tratta di una tecnica di compressione non conservativa in quanto non rende una riproduzione perfetta del segnale.

        • Il formato JPEG

          Il formato JPEG è in realtà un formato di codifica delle immagini come abbiamo già visto ma include una sofisticata architettura di compressione che si articola addirittura in 4 passi:

          Per il recupero dell'immagine originale i quattro passi vengono applicati in senso inverso.

          Con il formato JPEG si possono arrivare a ridurre certe immagini anche di un fattore 50. Tuttavia è necessario verificare se il risultato è soddisfacente.

          Potete vedere qualche esempio. Vediamo prima una fotografia a colori di un formato jpeg con un modesto fattore di compressione e quindi con un buon fattore di qualità.

        • Vediamo ora la stessa immagine con un fattore di compressione molto elevato .

        • La seconda immagine richiede il 15% di spazio in più rispetto alla prima.

          Vediamo ora lo stesso effetto su di un'immagine diagnostica e precisamente una sezione sagittale di un esame MRI cerebrale.

        • Questa immagine è in formato gif. Salviamola in formato jpeg con un grosso rapporto di compressione (circa il 15%), ecco il risultato .

          1. DCT (Discrete Cosine Transform). La DCT è una trasformazione matematica che fa capo ad una famosissima teoria di Fourier e che trasoforma i segnali in una loro rappresentazione fatta di una moltitudine di componenti ognuna delle quali caratterizzata da una precisa frequenza di oscillazione. Mediante tale trasformazione ci si sposta in quello che potremmo chiamare il mondo di Fourier dove diventa facile alterare (filtrare) informazioni di tipo diverso: per esempio diventa facile eliminare ciò che varia molto velocemente e lasciare ciò che varia lentamente. Applicando questo metodo alla digitalizzazione (ottenuta per esempio mediante uno scanner) di una fotografia molto ingrandita nella quale si vede la grana della pellicola si può pensare di ripulire l'immagine dalla struttura dettagliata della grana. Questa operazione di filtraggio di certe componenti viene eseguito nel passo 3 successivo.
          2. Compressione RLE (che abbiamo menzionato poco prima).
          3. Quantizzazione. Con questo processo si filtrano le componenti ottenute con la DCT applicata nel primo passo.
          4. Infine viene applicato il metodo di Huffman.
      • Tutti i formati di immagine che abbiamo menzionato usano qualche tecnica di compressione. Nella tabella seguente si riportano alcuni esempi.
        Formato Tecnica di compressione
        TIFF LZW
        GIF LZW
        PNG DEFLATE: LZ77 (simile a LZW) + Huffman
        JPEG DCT filtrata + RLE + Huffman
        BMP RLE
        PCX RLE

Comments (0)

You don't have permission to comment on this page.