Descrizione della Posizione Lavorativa
Axelera AI è una startup deep‑tech che sviluppa una piattaforma AI di nuova generazione per supportare chiunque voglia contribuire al progresso dell'umanità e al miglioramento del mondo.
In soli quattro anni abbiamo raccolto complessivamente $370 milioni e costruito un team di livello internazionale con oltre 220 dipendenti (tra cui più di 49 PhD che contano oltre 40.000 citazioni), operando da remoto in 18 paesi e con uffici in Belgio, Francia, Svizzera, Italia e Regno Unito; la nostra sede è al High Tech Campus di Eindhoven, Paesi Bassi.
Abbiamo lanciato la piattaforma Metis™ AI, che garantisce un aumento di efficienza e prestazioni di 3–5x, e disponiamo di un solido pipeline commerciale superiore a $100 milioni. La nostra forte spinta verso l'innovazione ci ha posizionati come pionieri globali nel settore.
Ruolo
Cerchiamo un Senior Platform Architect responsabile dell'architettura a livello di piattaforma per i nostri sistemi scale‑up e scale‑out, man mano che passiamo da prodotti con singolo acceleratore a soluzioni a livello di server e rack. Sarai responsabile di come gli acceleratori attuali e di prossima generazione si combinano in piattaforme ad alte prestazioni: topologia di sistema, integrazione host, organizzazione della memoria e requisiti di piattaforma necessari per raggiungere performance, scalabilità e operabilità. Il ruolo collabora strettamente con la divisione AI Infrastructure Systems, i team di architettura più ampi, le divisioni silicio e software, e prevede contatti diretti con clienti strategici ed ecosystem partner per l'allineamento tecnico.
Responsabilità principali
- Definire l'architettura di piattaforma per fabrics scale‑up e scale‑out su tutta la linea di acceleratori, da sistemi a nodo singolo fino a deployment a livello di rack.
- Specificare l'infrastruttura di interconnessione fisica e definire i requisiti architetturali e i trade‑off che la divisione AI Infrastructure Systems deve implementare, inclusa l'analisi di come le caratteristiche di interconnessione influenzano le prestazioni dei workload a livello di sistema.
- Tradurre requisiti di workload e performance in specifiche di architettura di sistema e interconnessione concrete.
- Definire l'integrazione host, coprendo PCIe, CXL e l'attach della memoria, e l'organizzazione della memoria a livello di sistema su tutta la piattaforma.
- Responsabilizzarsi sulle metriche di piattaforma: performance, consumo energetico, costo e scalabilità, assicurando che i design mantengano le prestazioni target nel passaggio da nodi singoli a cluster estesi.
- Definire i requisiti di operabilità e RAS (reliability, availability, serviceability) per rendere le piattaforme gestibili e affidabili in produzione.
- Assumere un ruolo tecnico di primo piano nel team di system architecture, allineando le decisioni architetturali con partner interni ed esterni, customer e system integrator; la responsabilità commerciale e il design‑in restano con il Direttore AIIS.
- Guidare metodologie e best practice per il design di piattaforma man mano che il team cresce.
Qualifiche richieste
- Esperienza: esperienza significativa (almeno 5+ anni) in architettura di sistema, piattaforma o hardware, con comprovata esperienza a livello server e/o rack.
- Conoscenze core: progettazione scale‑up e scale‑out, mappatura di workload distribuiti, partitioning funzionale e architettura di interconnessione/fabric.
- Fabrics & interconnect: conoscenza approfondita e pratica di Ethernet, UALink, tecnologie ottiche e switched‑fabric, con capacità di valutare i compromessi di prestazione a livello di sistema.
- Systems thinking: capacità di collegare le caratteristiche dei workload all'architettura hardware e quantificare l'impatto delle scelte progettuali sulle prestazioni end‑to‑end.
- Leadership & collaborazione: esperienza nel guidare e collaborare con team multidisciplinari e nell'interfacciarsi con partner e stakeholder di alto livello; ottime capacità di problem solving e mentalità collaborativa.
- Plus: esperienza nell'architettura di sistemi acceleratori AI/HPC, familiarità con workload distribuiti di training/inference e esposizione a deployment su scala data‑center.
Luogo di lavoro
Offriamo un'organizzazione di lavoro flessibile con le seguenti opzioni: lavorare da uno dei nostri uffici Axelera AI (Leuven, Belgio; Amsterdam o Eindhoven, Paesi Bassi; Zurigo, Svizzera; Firenze o Milano, Italia; Bristol, Regno Unito) se già residente nelle vicinanze; lavorare completamente in remoto da qualsiasi paese europeo (incluso il Regno Unito); trasferirsi e lavorare con noi dall'Italia (Firenze o Milano) o dai Paesi Bassi (Amsterdam o Eindhoven). Priorità sarà data ai candidati interessati a essere basati in Belgio o Italia.
Benefit
Avrai l'opportunità di contribuire a una realtà internazionale in rapida crescita. Offriamo un pacchetto retributivo competitivo, inclusi piano pensionistico, ampie coperture assicurative per i dipendenti e la possibilità di ottenere azioni societarie. Promuoviamo una cultura aperta che valorizza creatività e innovazione continua, con ownership collaborativa e libertà responsabile. Axelera AI è impegnata per la pari opportunità e la diversità, creando un ambiente inclusivo per tutti i candidati.
Requisiti
Almeno 5+ anni di esperienza in architettura di sistema/piattaforma/hardware, con comprovata esperienza a livello server o rack. Conoscenza approfondita di scale‑up/scale‑out, mapping di workload distribuiti, partitioning funzionale e architetture di interconnessione. Capacità di collegare workload all'architettura hardware e quantificare impatti di design. Esperienza di leadership e collaborazione cross‑funzionale. Preferibile esperienza con sistemi acceleratori AI/HPC, workload di training/inference distribuiti e deployment su scala data‑center.
Competenze richieste
Competenze professionali
Platform/System Architecture
Scale-up and scale-out design
Distributed workload mapping
Interconnect/Fabric architecture
Ethernet
UALink
Optical interconnects
Switched-fabric technologies
PCIe
CXL
Memory organization
Performance analysis
RAS (reliability
availability
serviceability)
Competenze trasversali
Leadership
Collaborazione
Problem solving
Pensiero sistemico
Comunicazione
Teamwork