Senior Platform Architect
Senior

Axelera AI's logo

Axelera AI

Firenze, Firenze, Toscana, Italia

Hybrid

Contratto a tempo indeterminato

Technology / AI & Hardware

Descrizione della Posizione Lavorativa

Axelera AI è una startup deep‑tech che sviluppa una piattaforma AI di nuova generazione per supportare chiunque voglia contribuire al progresso dell'umanità e al miglioramento del mondo.

In soli quattro anni abbiamo raccolto complessivamente $370 milioni e costruito un team di livello internazionale con oltre 220 dipendenti (tra cui più di 49 PhD che contano oltre 40.000 citazioni), operando da remoto in 18 paesi e con uffici in Belgio, Francia, Svizzera, Italia e Regno Unito; la nostra sede è al High Tech Campus di Eindhoven, Paesi Bassi.

Abbiamo lanciato la piattaforma Metis™ AI, che garantisce un aumento di efficienza e prestazioni di 3–5x, e disponiamo di un solido pipeline commerciale superiore a $100 milioni. La nostra forte spinta verso l'innovazione ci ha posizionati come pionieri globali nel settore.

Ruolo

Cerchiamo un Senior Platform Architect responsabile dell'architettura a livello di piattaforma per i nostri sistemi scale‑up e scale‑out, man mano che passiamo da prodotti con singolo acceleratore a soluzioni a livello di server e rack. Sarai responsabile di come gli acceleratori attuali e di prossima generazione si combinano in piattaforme ad alte prestazioni: topologia di sistema, integrazione host, organizzazione della memoria e requisiti di piattaforma necessari per raggiungere performance, scalabilità e operabilità. Il ruolo collabora strettamente con la divisione AI Infrastructure Systems, i team di architettura più ampi, le divisioni silicio e software, e prevede contatti diretti con clienti strategici ed ecosystem partner per l'allineamento tecnico.

Responsabilità principali

  • Definire l'architettura di piattaforma per fabrics scale‑up e scale‑out su tutta la linea di acceleratori, da sistemi a nodo singolo fino a deployment a livello di rack.
  • Specificare l'infrastruttura di interconnessione fisica e definire i requisiti architetturali e i trade‑off che la divisione AI Infrastructure Systems deve implementare, inclusa l'analisi di come le caratteristiche di interconnessione influenzano le prestazioni dei workload a livello di sistema.
  • Tradurre requisiti di workload e performance in specifiche di architettura di sistema e interconnessione concrete.
  • Definire l'integrazione host, coprendo PCIe, CXL e l'attach della memoria, e l'organizzazione della memoria a livello di sistema su tutta la piattaforma.
  • Responsabilizzarsi sulle metriche di piattaforma: performance, consumo energetico, costo e scalabilità, assicurando che i design mantengano le prestazioni target nel passaggio da nodi singoli a cluster estesi.
  • Definire i requisiti di operabilità e RAS (reliability, availability, serviceability) per rendere le piattaforme gestibili e affidabili in produzione.
  • Assumere un ruolo tecnico di primo piano nel team di system architecture, allineando le decisioni architetturali con partner interni ed esterni, customer e system integrator; la responsabilità commerciale e il design‑in restano con il Direttore AIIS.
  • Guidare metodologie e best practice per il design di piattaforma man mano che il team cresce.

Qualifiche richieste

  • Esperienza: esperienza significativa (almeno 5+ anni) in architettura di sistema, piattaforma o hardware, con comprovata esperienza a livello server e/o rack.
  • Conoscenze core: progettazione scale‑up e scale‑out, mappatura di workload distribuiti, partitioning funzionale e architettura di interconnessione/fabric.
  • Fabrics & interconnect: conoscenza approfondita e pratica di Ethernet, UALink, tecnologie ottiche e switched‑fabric, con capacità di valutare i compromessi di prestazione a livello di sistema.
  • Systems thinking: capacità di collegare le caratteristiche dei workload all'architettura hardware e quantificare l'impatto delle scelte progettuali sulle prestazioni end‑to‑end.
  • Leadership & collaborazione: esperienza nel guidare e collaborare con team multidisciplinari e nell'interfacciarsi con partner e stakeholder di alto livello; ottime capacità di problem solving e mentalità collaborativa.
  • Plus: esperienza nell'architettura di sistemi acceleratori AI/HPC, familiarità con workload distribuiti di training/inference e esposizione a deployment su scala data‑center.

Luogo di lavoro

Offriamo un'organizzazione di lavoro flessibile con le seguenti opzioni: lavorare da uno dei nostri uffici Axelera AI (Leuven, Belgio; Amsterdam o Eindhoven, Paesi Bassi; Zurigo, Svizzera; Firenze o Milano, Italia; Bristol, Regno Unito) se già residente nelle vicinanze; lavorare completamente in remoto da qualsiasi paese europeo (incluso il Regno Unito); trasferirsi e lavorare con noi dall'Italia (Firenze o Milano) o dai Paesi Bassi (Amsterdam o Eindhoven). Priorità sarà data ai candidati interessati a essere basati in Belgio o Italia.

Benefit

Avrai l'opportunità di contribuire a una realtà internazionale in rapida crescita. Offriamo un pacchetto retributivo competitivo, inclusi piano pensionistico, ampie coperture assicurative per i dipendenti e la possibilità di ottenere azioni societarie. Promuoviamo una cultura aperta che valorizza creatività e innovazione continua, con ownership collaborativa e libertà responsabile. Axelera AI è impegnata per la pari opportunità e la diversità, creando un ambiente inclusivo per tutti i candidati.

Requisiti

Almeno 5+ anni di esperienza in architettura di sistema/piattaforma/hardware, con comprovata esperienza a livello server o rack. Conoscenza approfondita di scale‑up/scale‑out, mapping di workload distribuiti, partitioning funzionale e architetture di interconnessione. Capacità di collegare workload all'architettura hardware e quantificare impatti di design. Esperienza di leadership e collaborazione cross‑funzionale. Preferibile esperienza con sistemi acceleratori AI/HPC, workload di training/inference distribuiti e deployment su scala data‑center.

Competenze richieste

  • Competenze professionali
  • Platform/System Architecture Scale-up and scale-out design Distributed workload mapping Interconnect/Fabric architecture Ethernet UALink Optical interconnects Switched-fabric technologies PCIe CXL Memory organization Performance analysis RAS (reliability availability serviceability)
  • Competenze trasversali
  • Leadership Collaborazione Problem solving Pensiero sistemico Comunicazione Teamwork