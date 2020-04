Ce site peut gagner des commissions d’affiliation à partir des liens sur cette page. Conditions d’utilisation.

Il existe certains termes de l’art dans la technologie des semi-conducteurs qui sont devenus des pierres de touche courantes. La loi de Moore, la mise à l’échelle de Dennard et des concepts comme le «mur de mémoire» font référence à des tendances technologiques établies de longue date qui refont souvent surface dans de nombreux domaines d’expertise. Dans cet esprit, il y a un concept dont nous allons discuter aujourd’hui que certains d’entre vous connaissent peut-être, mais qui a suscité relativement peu d’attention: la vague de Makimoto. Bien qu’il ne remonte pas aussi loin que le papier séminal de Gordon Moore, l’argument de Makimoto a une incidence directe sur le marché en plein essor de l’IA et des appareils d’apprentissage automatique.

Présentée pour la première fois en 1991 par le Dr Tsugio Makimoto, ancien PDG de Hitachi Semiconductors et ancien directeur technique de Sony, la vague de Makimoto est un moyen de décrire comment le marché des semi-conducteurs oscille souvent entre spécialisation et standardisation. Ces cycles se sont souvent produits à intervalles d’environ 10 ans, bien qu’il y ait eu un désaccord dans un espace plus large sur la question de savoir si les cycles 1997-2007 et 2007-2017 étaient suffisamment forts pour être admissibles.

Cependant, la théorie n’est pas contestée pour les cycles précédents. De 1957 à 1967, les composants discrets normalisés ont dominé le marché, suivis des puces d’intégration à grande échelle personnalisées, qui ont cédé la place aux premières technologies de microprocesseur et de mémoire normalisées.

Il n’est pas clair que la vague classique de Makimoto, comme illustré ci-dessus, s’aligne proprement avec la poussée actuelle dans l’IA et le ML. Il prévoit que le marché devrait s’orienter vers la normalisation à partir de 2017, alors qu’en réalité, nous assistons à une formidable poussée de la part d’un large éventail d’entreprises pour créer leurs propres architectures d’accélérateurs personnalisées pour les charges de travail spécialisées en IA et ML. Avec tout le monde, de Fujitsu à Google en passant par Nvidia et AMD, jetant un chapeau proverbial dans le ring, le pendule semble s’orienter plus loin vers la personnalisation, pas déjà en train de revenir à la normalisation.

Mais il n’est pas inhabituel qu’une théorie généralement acceptée expliquant certains aspects du progrès des semi-conducteurs ne parvienne pas à correspondre parfaitement à la vie réelle. La loi de Moore, dans son incarnation originale, prédit le doublement du nombre de transistors chaque année. En 1975, Gordon Moore a révisé sa prédiction à tous les deux ans. Le taux réel auquel le nombre de transistors a doublé dans les produits d’expédition a toujours varié quelque peu en fonction des difficultés de transition des nœuds de fonderie, des conditions du marché et du succès ou de l’échec des équipes de conception de CPU. Même la mise à l’échelle de la loi de Moore a ralenti ces dernières années, bien que les améliorations de la densité ne se soient pas encore arrêtées. Après l’arrêt de la mise à l’échelle de Dennard en 2004, la mise à l’échelle de la densité est devenue la seule mesure qui continue de suivre quelque chose comme son ancienne trajectoire historique.

Et étant donné la façon dont la mise à l’échelle du processeur à usage général a radicalement changé entre les époques antérieures et aujourd’hui, nous devons tenir compte du fait que le pendule peut ne pas osciller exactement de la même manière qu’auparavant. La vidéo ci-dessous, racontée par Tsugio Makimoto, n’est pas nouvelle – elle a été publiée en 2013 – mais elle offre une explication supplémentaire du concept à toute personne intéressée.

Un article à SemiEngineering détaille la ruée des entreprises travaillant sur des architectures d’accélérateurs spécialisés et pourquoi le domaine est brûlant. Face au manque de progrès dans le calcul à usage général, les entreprises ont tourné leur attention vers les accélérateurs, dans l’espoir de trouver des charges de travail et des cœurs qui correspondent bien les uns aux autres. Ainsi, il pourrait sembler que le pendule s’éloigne en permanence du calcul à usage général.

Mais cela est effectivement impossible à long terme. Bien que rien n’empêche une entreprise de développer une architecture spécialisée pour traiter une charge de travail bien connue, toutes les charges de travail ne peuvent pas être décrites de cette manière. Comme Chris Jones, vice-président du marketing chez Codasip, l’a déclaré à SemiEngineering: «Il y aura toujours des cas où le logiciel qui sera exécuté sur une puce donnée est largement inconnu, et si la charge logicielle est indéterminée, tout ce que le concepteur de puce peut faire est fournir une plate-forme de calcul générale robuste où les performances sont purement fonction de la fréquence centrale et de la latence de la mémoire. »

En d’autres termes, vous ne pouvez pas simplement créer une gamme d’accélérateurs matériels pour couvrir chaque charge de travail. Le calcul à usage général reste essentiel au processus. Les implémentations de travail personnalisées deviennent également standardisées au fil du temps, les entreprises se concentrant sur des implémentations optimales pour gérer certains types de travail.

Il y a un certain chevauchement important entre le comportement décrit par la vague de Makimoto et le mur d’accélérateur imminent dont nous avons discuté plus tôt cette semaine. Le document d’accélération-mur démontre que nous ne pouvons pas compter sur des solutions d’accélérateur pour fournir des améliorations de performances infinies en l’absence de la capacité d’améliorer les aspects sous-jacents des performances des transistors via la loi de Moore. La vague de Makimoto décrit la tendance générale de l’industrie à osciller entre les deux. Le flot récent d’argent de capital-risque sur les marchés de l’IA et du machine learning a conduit à un véritable battage médiatique autour de ces capacités. L’IA et l’apprentissage automatique pourraient en effet révolutionner l’informatique dans les années à venir, mais la nouvelle tendance à l’utilisation d’accélérateurs pour ces charges de travail doit être comprise dans le contexte des limites de cette approche.

