Networking in Java

Introduzione

La piattaforma java è molto apprezzato anche a causa della sua idoneità per la scrittura di programmi che utilizzano e interagiscono con le risorse su Internet. In particolare ciò che rende java un linguaggio adatto per il networking è il package java.net che sarà analizzato in questo articolo. In esso sono contenute classi ed interfacce che implementano le funzionalità di comunicazione di basso livello. In particolare forniscono supporto a due protocolli base:

  • TCP (Transmission Control Protocol): un protocollo di comunicazione affidabile tra applicazioni, tipicamente utilizzato dal protocollo IP (Internet Protocol) per realizzare lo stack TCP/IP.
  • UDP (User Datagram Protocol): un protocollo di comunicazione connection-less quindi non affidabile per la trasmissione di pacchetti di dati tra applicazione.

L’astrazione utilizzata per la rappresentazione del canale di comunicazione è quello delle socket. Considerando il classico paradigma client-server, un’entità client crea una socket tentando di connettersi verso un’altra entità server, la quale, rilevato il tentativo di connessione, apre una socket dal suo lato del canale e, stabilita in questo modo la connessione, le due entità possono comunicare. Generalmente tali entità sono dei programmi che possono risiedere su computer differenti ma collegati in rete ed univocamente identificati tramite un indirizzo IP.

Un client, quindi, per comunicare con un server tramite il protocollo TCP/IP, dovrà per prima cosa creare una socket verso tale server, specificando:

  1. l’indirizzo IP della macchina su cui il server è in esecuzione;
  2. il numero di porta sulla quale il server è in ascolto.

Il concetto di porta consente di esporre più servizi contemporaneamente sullo stesso computer, permettendo sostanzialmente di avere in esecuzione programmi server diversi, in ascolto su porte diverse. Il numero di porta è un intero compreso fra 1 e 65535. Il protocollo TCP/IP riserva le porte minori di 1024 ad un set di servizi standard come, ad esempio, la porta 21 per l’FTP, la 23 per il Telnet, la 25 per la posta elettronica, la 80 per l’HTTP.

Risoluzione dei Nomi

Un indirizzo IP è costituito da 32 bit (nella specifica IPv4) o 128 bit (nella specifica IPv6). Per evidenti ragioni di semplicità agli indirizzi IP è spesso associato un nome, la cui risoluzione (conversione in IP) è realizzata da un servizio DNS (Domani Name Service). L’accesso a tale servizio in java si realizza utilizzando la classe InetAddress, che non ha costruttori, ma che fornisce metodi statici per la creazione di un oggetto di tale tipo.

Nell’esempio seguente sono recuperate le informazioni relative al sito www.javaboss.it:

Manipolazione di URL

Java fornisce una classe specifica per la manipolazione delle URL (Uniform Resource Locator). Esistono diversi costruttori di tale classe perché molti sono i modi in cui una URL può essere specificata.

Il codice presentato stampa a video:

Lettura e Scrittura da una URL

La classe URL offre inoltre metodi specifici per aprire la connessione verso l’url indicato e leggere lo stream di quanto restituito dal server. In particolare getContent() converte direttamente lo stream in un oggetto il cui tipo dipende dal contenuto dell’url, ad esempio sarà Image se è una immagine o String se è un file di testo. Vediamo invece un esempio di utilizzo del metodo openStream(), che restituisce un InputStream dal quale è possibile leggere i contenuti del file richiesto.

Se si intende però utilizzare la connessione verso l’url anche per l’invio di informazioni al server è necessario utilizzare un oggetto URLConnection, che può essere ottenuto o invocando il metodo openConnection() sull’oggetto URL, o utilizzando il costruttore di una delle classi derivate da URLConnection. Tale classe infatti è astratta ed il suo costruttore è definito protected.

La connessione al server avviene invocando il metodo connect() e non alla istanziazione della classe, mentre i metodo getInputStream()getOutputStream() restituiscono rispettivamente uno stream per leggere dell’url ed uno per scrivere.

Vediamo un esempio che utilizza il servizio ospitato su http://httpbin.org/ per il test dell’invio di parametri con una request di tipo POST. Nell’esempio i parametri inviati sono param1 e param2 con valori value1 e value2. Il servizio restituisce un JSON con gli stessi parametri ricevuti.

La stringa JSON restituita, ripulita di quanto non di nostro interesse, è:

Le Socket

Vediamo infine come un client può aprire una connessione verso un server utilizzo in modo esplicito un oggetto di tipo Socket. Per farlo è sufficiente utilizzare uno dei suoi costruttori che accettano come parametro l’host ed il numero di porta, ed invocare i metodo getInputStream()getOutputStream(), tramite i quali è possibile ottenere gli stream con cui comunicare attraverso la connessione TCP instaurata alla creazione della socket. In realtà gli oggetti restituiti sono rispettivamente di tipo SocketInputStream SocketOutputStream, classi che in non sono pubbliche. Quando si comunica attraverso connessioni TCP, infatti, i dati vengono suddivisi in pacchetti, quindi è consigliabile non utilizzare tali stream direttamente, ma è meglio costruire stream bufferizzati, evitando così di avere pacchetti contenenti poche informazioni.

Dall’esempio si nota anche che l’oggetto Socket ha un metodo getLocalPort() che restituisce il numero della porta locale. Quando ci si connette ad un server infatti, anche sulla macchina locale, sulla quale viene creata la socket, si userà per tale socket una determinata porta, assegnata dal sistema operativo, scegliendo il primo numero di porta non occupato. Questo perché ogni connessione TCP consiste sempre di un indirizzo locale e di uno remoto, e di un numero di porta locale e un numero di porta remoto.

Infine la richiesta inviata al server tramite lo stream di output è una istruzione GET che fa parte del protocollo HTTP. In questo caso quindi, il server remoto è un web server in grado di interpretare la richiesta ed eseguirla. Nel caso specifico il client chiede al server di restituire il file associato all’url http://httpbin.org/html, comportandosi di fatto come un comune browser web.

Fino ad ora abbiamo visto metodi per aprire una connessione verso un server in esecuzione su un host remoto. Vediamo ora come, utilizzando la classe SocketServer, un programma server possa mettersi in ascolto in attesa di una richiesta di connessione da parte di un programma client. Il programma server dovrà eseguire le seguenti attività:

  1. Creare un oggetto di tipo ServerSocket specificando un numero di porta locale;
  2. Attendere, tramite il metodo accept() una richiesta di connessione da un client;
  3. Utilizzare la socket ottenuta ad ogni connessione, per comunicare con il client.

Nel fare questo però, il server deve essere in grado di soddisfare connessioni multiple provenienti da client differenti. A tale scopo utilizzeremo il supporto al multithreading di java. Il flusso descritto sopra dovrà quindi essere adattato in modo che il un thread principale resti in attesa di connessione, bloccato sul metodo accept() e, non appena arrivi una richiesta da un client, creai un nuovo thread per gestire la richiesta. Il thread principale torna quindi ad attendere nuove connessioni.

Vediamo un esempio di server implementando un ParrotServer, ovvero un server che ripete a pappagallo quanto ricevuto dal client. Innanzitutto avremo bisogno de thread principale che attende  le connessioni:

Mentre il thread di gestione della connessione è il seguente. Si noti che, dopo l’invio del messaggio di benvenuto, il parrot server ripete quanto trasmessogli dal client fino alla ricezione del carattere CR (Carriage return), a seguito del quale si interrompe.

Per completezza riportiamo anche un client di interazione col parrot server:

User Datagram Protocol (UDP)

Finora abbiamo sempre parlato del protocollo TCP (Transfer Control Protocol), che nello stack di comunicazione è collocato immediatamente sopra l’IP (Internet Protocol). Un altro protocollo basato sempre sull’IP, è l’UDP (User Datagram Protocol) di qui daremo solamente qualche cenno.

Innanzitutto si tratta di un protocollo non basato sulla connessione (connectionless) e che non garantisce né l’arrivo né l’ordine dei pacchetti. La sola cosa garantita è la loro integrità. Nel protocollo TCP, si deve prima di tutto stabilire una connessione, dopo di che tale connessione può essere utilizzata sia per spedire che per ricevere informazioni. Quando la comunicazione è terminata, la connessione deve essere chiusa. Nell’UDP, invece, ogni messaggio sarà spedito come un pacchetto indipendente, che seguirà un percorso indipendente. Oltre a non garantire l’arrivo di tali pacchetti il protocollo non garantisce nemmeno che i pacchetti arrivino nell’ordine in cui sono stati spediti, e che non ci siano duplicati.

Il protocollo UDP si utilizza sostanzialmente quando si necessita di comunicazioni con poco overhead ed in cui non è importante se i pacchetti arrivino in ordine o meno, anzi molto spesso l’arrivo di un pacchetto “vecchio” comporta la sua eliminazione. Un’applicazione di esempio è lo streaming di video.

Il supporto a tale protocollo è offerto da java attraverso le classi DatagramPacket e DatagramSocket.