Bytecode

linguaggio intermedio situato tra quello macchina e quello di programmazione

In informatica, il bytecode è un linguaggio intermedio più astratto tra il linguaggio macchina e il linguaggio di programmazione, usato per descrivere le operazioni che costituiscono un programma. È così chiamato perché spesso le operazioni hanno un codice che occupa un solo byte, anche se la lunghezza dell'intera istruzione può variare perché ogni operazione ha un numero specifico di parametri su cui operare. I parametri di queste operazioni possono consistere di registri o indirizzi di memoria, un po' come accade per il linguaggio macchina.

Descrizione

modifica

Un linguaggio intermedio come il bytecode è molto utile a coloro che realizzano linguaggi di programmazione perché riduce la dipendenza dall'hardware e facilita la creazione degli interpreti del linguaggio stesso.

Il bytecode può anche essere usato come rappresentazione intermedia di un programma da far compilare a un tipo speciale di compilatore, chiamato compilatore just-in-time il quale traduce il bytecode in linguaggio macchina immediatamente prima dell'esecuzione del programma stesso, per velocizzarne l'esecuzione.

Un programma in bytecode è eseguito mediante un secondo programma che ne interpreta le istruzioni. Questo interprete è spesso indicato con il termine macchina virtuale, in quanto può essere visto dal programmatore come un computer astratto che realizza al suo interno gran parte delle funzionalità di un computer reale. Questa astrazione consente di scrivere programmi portabili e cioè architettati in modo tale da poter essere eseguiti su diversi tipi di sistemi operativi e di architetture hardware. Questo è un vantaggio che hanno anche i linguaggi interpretati, tuttavia un interprete di bytecode risulta essere molto più veloce di un interprete di un linguaggio di programmazione ad alto livello perché è un linguaggio con poche e semplici istruzioni e più vicino al modo di funzionamento dell'hardware (processore e memoria) del computer.

La prima implementazione di compilatore da codice sorgente a bytecode, nonché di interprete di bytecode, è stato il sistema Smalltalk, sviluppato negli anni 1970 al centro di ricerca di Palo Alto della Xerox.

Il linguaggio più famoso tra quelli che fanno uso del bytecode è Java. Java ha sia una macchina virtuale (Java Virtual Machine) che interpreta il codice bytecode, sia un compilatore just-in-time che traduce il bytecode in linguaggio macchina. La piattaforma .NET, e quindi anche il linguaggio C#, ha a disposizione tecniche simili a quelle del linguaggio Java. Il linguaggio Gambas fa uso di Bytecode.

Oggi, per migliorare la velocità di esecuzione, anche molti linguaggi dinamici, come PHP, Python, Ruby > 1.8 o Tcl fanno uso del bytecode in maniera più o meno esplicita a seconda delle implementazioni. Essi traducono il programma in bytecode e poi lo interpretano tramite una macchina virtuale. I linguaggi Ruby 1.8 o Perl[1], invece, non usano il bytecode, ma traducono il codice in una struttura sintattica ad albero che ricorda molto la rappresentazione intermedia che si usa nei compilatori; tale struttura viene poi usata dall'interprete per eseguire il programma.

Un tipo particolare di bytecode è costituito dai p-Code, che possono occupare più di un singolo byte e avere istruzioni di varie dimensioni, un po' come le opcode di molte CPU. I p-Code funzionano a un livello di astrazione molto più alto rispetto ai bytecode, essi, ad esempio, possono avere operazioni tipo "stampa questa stringa" o "pulisci lo schermo". Sia il linguaggio BASIC che alcune versioni del Pascal usano i p-Code.

  1. ^ Perl ha solo un supporto sperimentale per la pre-compilazione. Beattie, Malcolm and Enache Adrian, B::Bytecode Perl compiler's bytecode backend, su search.cpan.org, CPAN, 2003.

Voci correlate

modifica

Collegamenti esterni

modifica
  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica