On présente souvent le mainframe comme une plateforme du passé, figée et condamnée à survivre par inertie. La réalité est tout autre. Annoncé le 5 avril 2022, l'IBM z16 illustre une plateforme qui continue d'innover sur deux fronts parmi les plus avancés de l'industrie : l'intelligence artificielle et la cryptographie post-quantique.
Telum : de l'IA gravée dans le silicium
Le z16 repose sur le processeur Telum, gravé en 7 nanomètres, qui embarque pour la première fois un accélérateur d'IA directement sur la puce. Cette intégration on-chip change tout : l'inférence ne quitte jamais le processeur, ce qui élimine les allers-retours réseau habituels vers un serveur d'IA externe.
Le résultat concret, c'est la capacité d'exécuter un modèle d'IA pendant le déroulement même de la transaction. Sur un paiement, par exemple, le système peut évaluer le risque de fraude avant que l'opération ne soit validée, et non quelques minutes ou quelques heures après coup.
Une détection de fraude à l'échelle
Le gain est d'abord une affaire d'échelle. Le z16 est dimensionné pour traiter jusqu'à 300 milliards de requêtes d'inférence par jour, avec une latence de l'ordre de la milliseconde. C'est cette combinaison débit + latence qui rend possible le scoring de chaque opération en temps réel.
Avant cette génération, la contrainte de latence imposait des compromis lourds. Les établissements ne pouvaient analyser qu'une fraction des flux - souvent moins de 10 % des transactions faisaient l'objet d'une détection de fraude réellement intégrée. Tout le reste passait, et une part de la fraude n'était identifiée qu'a posteriori, une fois l'argent parti.
Le premier système quantum-safe
Le z16 est aussi présenté par IBM comme le premier système quantum-safe du marché. Il s'appuie sur une cryptographie à réseaux euclidiens (lattice-based), conçue pour résister aux futures attaques par ordinateur quantique.
L'enjeu porte un nom : « harvest now, decrypt later ». Des données chiffrées aujourd'hui peuvent être interceptées et stockées, puis déchiffrées plus tard, le jour où un ordinateur quantique suffisamment puissant existera. Pour des données à longue durée de vie - dossiers bancaires, contrats d'assurance, données de santé -, anticiper cette menace n'est pas théorique : c'est une exigence de conformité à venir.