Come vengono fornite grandi siti web a milioni di utenti? (ad es. Google)

Apprezzo che questa domanda potrebbe essere vaga / troppo ampia, ma sto cercando i principi di base / un riepilogo.

Come funziona, ad esempio, un sito come Google o Facebook, che si occupa delle miliardi di visualizzazioni di pagina che riceve?

  • È James stabile per l'utilizzo della produzione?
  • Server di printing di Windows Server 2008 R2 - Modifica dei nomi della printingnte in tutti i sisthemes client
  • La networking di monitoraggio scende tra i server di Windows Server 2003
  • Sede e DNS
  • Risoluzione DNS per example.com - Puoi spiegare?
  • DNS A vs NS record
  • Sono a conoscenza di DNS rotondo, che, a mio avviso, serve un IP al visitatore A, poi un altro IP al visitatore B in modo rotondo e così via.

    Questi siti gestiscono diversi server (centinaia) che dispongono di una copia del sito web "google" su ciascun server e sono tutti sincronizzati?

    Per cercare di riassumere – come i siti molto grandi con milioni di visualizzazioni di pagina si occupano effettivamente del traffico? Come vengono mantenuti? E da where andare ad avere esperienza per impostare questo?

    Vorrei scoprire di più, ma senza aver bisogno di una tale istituzione, ho difficoltà a trovare studi di casi o materiale per saperne di più.

    Spero che questo fa un certo senso di senso. Grazie.

  • Come interagisce ITU G.9954 Ethernet su networking coassiale (EoCNA) con i segnali TV via cavo?
  • Come colbind un collegamento Ethernet via USB alla networking host?
  • Come abilitare l'esplorazione di file a tutti i diritti su /?
  • Strano problema di connettività di networking
  • networking di banchina che si blocca casualmente
  • Utilizzo quotidiano, settimanale e mensile di Linux
  • 3 Solutions collect form web for “Come vengono fornite grandi siti web a milioni di utenti? (ad es. Google)”

    Riepilogo: i grandi clienti aziendali come la pianificazione di volo in aereo usano Oracle, Sun, IBM Bladecenters e codice personalizzato, grandi aziende come eBay, Twitter, Facebook, Google usano tutto ciò che è imposto, tutto ciò che può fare il lavoro e lo tiene anche segreto. una delle cose molto difficili che hanno dovuto risolvere per rendere ansible la loro azienda a tutti.

    I piccoli webserver sono diventati molto comuni, e in genere vednetworking un server web come Apache, Tomcat o IIS e forse con un database dietro di esso (PostgreSQL, SQL Server o MySQL) e magari con un livello di programmazione anche lì (PHP, Python, Ruby, Java, ecc.).

    Per le configurazioni più grandi, ma ancora piccole, si separano questi livelli in diversi server: due Apache in esecuzione che guardano lo stesso file condiviso, due che eseguono il database con metà dei dati in ciascuno, forse un altro fa la cache o forse li fai solo come potenti come potete permetterti. Ciò può farti un lungo cammino – Molti pesci sono entrati nei migliori siti web di HitWise nel 2007, servendo 2 milioni di + visualizzazioni all'ora, con 1 server e l'image di outsourcing hosting a Akamai.

    Se sei ricco, ad esempio il governo, l'industria aerea, ecc. Puoi scalare da qui accedendo a server massicci e specializzati come i bladecenters, i server Sun di dieci processri, decine di dischi in un dispositivo di archiviazione e database Oracle , eccetera.

    Per tutti gli altri, la questione di come scalare l'economia è ancora senza risposta. Come lo fanno è uno dei problemi fondamentali della loro azienda, e uno spenderà un sacco di sforzi per build su misura.

    Probabilmente è costituito da modi interessanti per get molti server di database coinvolti. Non Google, hanno scritto la propria sostituzione del filesystem e del database in cima . Potresti vedere sharding (dividere i tuoi contenuti AM in un server, NZ in un altro) o replicare (tutti i server hanno gli stessi dati, le letture provengono da ognuno di essi, scrive vai a tutti) o qualcosa di personalizzato.

    Probabilmente sarà costituito da un sacco di server di cache, ad esempio eseguendo Memcached. Questi avranno un sacco di RAM e tornano rapidamente query di database che sono state fatte prima di recente, i file che sono stati richiesti di recente. Nel 2008, Facebook ha dichiarato: "Usiamo più di 800 server memcached che forniscono oltre 28 terabyte di memory ai nostri utenti". collegamento

    Probabilmente troverai un servizio CDN (networking di consegna dei contenuti) come Akamai, where ti dà tutte le tue foto e li diffonde in tutto il mondo e ti colleghi a loro e serve automaticamente il più vicino all'utente dalla loro networking.

    Troverai anche un sacco di codice personalizzato e persone che lavorano duramente ma mantenerlo un segreto. Servire aste eBay significa gestire un sacco di traffico ma i dati per un singolo articolo di aste sono per lo più statici, ma la ricerca di aste eBay significa un sacco di elaborazione dati. Google che cerca il web significa un sacco di elaborazione dati, ma in modo diverso – diversi dati memorizzati su un altro server. Facebook significa un sacco di informazioni che attraversano criss-cross a molti utenti, e anche Twitter, ma con caratteristiche diverse. Google e Facebook progettano il proprio hardware server.

    Hanno molte posizioni diverse e tutti gli utenti sono indirizzati alla posizione più vicina. Questo è fatto con Anycast .

    In each posizione hanno poi molti server front-end (server web) e nel backend sono diversi cluster di database differenti. Spesso essi stanno facendo la banca dati che scura lì.

    Spesso c'è un livello tra i terminali di destinazione frontali ei server di database backend. In questo livello tutto il calcolo e l'elaborazione dei dati sono in corso. Google utilizza lì la mappa riduce .

    Questa è una introduzione molto breve ma i collegamenti dovrebbero aiutarti a trovare informazioni più dettagliate.

    Come funziona, ad esempio, un sito come Google o Facebook, che si occupa delle miliardi di visualizzazioni di pagina che riceve?

    Molti molti server in molti centri dati.

    Sono a conoscenza di DNS rotondo, che, a mio avviso, serve un IP al visitatore A, poi un altro IP al visitatore B in modo rotondo e così via.

    Ah. No. esso restituisce diversi IP (round robin) su each richiesta, ma questo noct significa necessariamente each visitatore.

    Questi siti gestiscono diversi server (centinaia) che dispongono di una copia del sito web "google" su ciascun server e sono tutti sincronizzati?

    No. Fai questo "decine di tousands" di server e la risposta è sì. Google gestisce un LOT dei data center con 100.000+ server in ciascuno.

    E usano il routing AS per redirect il traffico al centro dati più vicino.

    Suggerimenti per Linux e Windows Server, quali Ubuntu, Centos, Apache, Nginx, Debian e argomenti di rete.