Avec la technologie qui progresse si rapidement autour de nous, des idées fausses peuvent parfois se frayer un chemin dans notre compréhension commune. Dans cet article, nous allons prendre du recul et passer en revue certaines des choses les plus courantes que les gens se trompent en parlant de matériel informatique. Pour chacun d'eux, nous énumérerons l'erreur commune ainsi que les raisons pour lesquelles elle n'est pas exacte.
#1 Vous pouvez comparer les processeurs par nombre de cœurs et vitesse d'horloge
Si vous êtes dans le domaine de la technologie depuis un certain temps, vous avez peut-être entendu quelqu'un faire la comparaison suivante: «Le processeur A a 4 cœurs et fonctionne à 4 GHz. Le processeur B a 6 cœurs et fonctionne à 3 GHz. Depuis 4 * 4 = 16 est inférieur à 6 * 3 = 18, le CPU B doit être meilleur ". C'est l'un des péchés cardinaux du matériel informatique. Il y a tellement de variations et de paramètres qu'il est impossible de comparer les processeurs de cette façon.
Pris isolément et toutes choses étant égales par ailleurs, un processeur à 6 cœurs sera plus rapide que le même design à 4 cœurs. De même, un processeur fonctionnant à 4 GHz sera plus rapide que la même puce fonctionnant à 3 GHz. Cependant, une fois que vous commencez à ajouter la complexité des puces réelles, la comparaison n'a plus de sens.
Il existe des charges de travail qui préfèrent une fréquence plus élevée et d'autres qui bénéficient de plus de cœurs. Un processeur peut consommer tellement plus d'énergie que l'amélioration des performances est sans valeur. Un processeur peut avoir plus de cache que l'autre ou un pipeline plus optimisé. La liste des traits que la comparaison originale manque est infinie. Veuillez ne jamais comparer les processeurs de cette façon.
# 2 La vitesse d'horloge est l'indicateur de performance le plus important
S'appuyant sur la première idée fausse, il est important de comprendre que la vitesse d'horloge n'est pas tout. Deux processeurs de la même catégorie de prix fonctionnant à la même fréquence peuvent avoir des performances très variables.
Certes, la vitesse de base a un impact, mais une fois que vous atteignez un certain point, d'autres facteurs jouent un rôle beaucoup plus important. Les processeurs peuvent passer beaucoup de temps à attendre d'autres parties du système, la taille et l'architecture du cache sont donc extrêmement importantes. Cela peut réduire le temps perdu et augmenter les performances du processeur.
L'architecture générale du système peut également jouer un rôle important. Il est tout à fait possible qu'un processeur lent puisse traiter plus de données qu'un processeur rapide si son architecture interne est mieux optimisée. Si quoi que ce soit, la performance par watt devient le facteur dominant utilisé pour quantifier les performances dans les nouvelles conceptions.
# 3 La puce principale qui alimente votre appareil est un processeur
C'est quelque chose qui était absolument vrai, mais qui devient de moins en moins vrai chaque jour. Nous avons tendance à regrouper un tas de fonctionnalités dans l'expression «CPU» ou «processeur» alors qu'en réalité, ce n'est qu'une partie d'une vue d'ensemble. La tendance actuelle, connue sous le nom de calcul hétérogène, consiste à combiner de nombreux éléments informatiques dans une seule puce.
D'une manière générale, les puces de la plupart des ordinateurs de bureau et portables sont des processeurs. Cependant, pour presque tous les autres appareils électroniques, vous regardez plus que probablement un système sur puce (SoC).
Une carte mère de PC de bureau peut offrir l'espace nécessaire pour répartir des dizaines de puces discrètes, chacune servant une fonctionnalité spécifique, mais ce n'est tout simplement pas possible sur la plupart des autres plates-formes. Les entreprises essaient de plus en plus d'intégrer autant de fonctionnalités que possible sur une seule puce pour obtenir de meilleures performances et une meilleure efficacité énergétique.
En plus d'un processeur, le SoC de votre téléphone a probablement également un GPU, une RAM, des encodeurs / décodeurs multimédias, un réseau, une gestion de l'alimentation et des dizaines d'autres composants. Bien que vous puissiez le considérer comme un processeur au sens général, le processeur réel n'est qu'un des nombreux composants qui composent un SoC moderne.
# 4 Le nœud technologique et la taille des fonctionnalités sont utiles pour comparer les puces
Il y a eu beaucoup de buzz récemment sur le retard d'Intel dans le déploiement de leur prochain nœud technologique. Lorsqu'un fabricant de puces comme Intel ou AMD conçoit un produit, celui-ci sera fabriqué à l'aide d'un processus technologique spécifique. La métrique la plus couramment utilisée est la taille des minuscules transistors qui composent le produit.
Cette mesure est effectuée en nanomètres et plusieurs tailles de processus courantes sont 14 nm, 10 nm, 7 nm et 3 nm. Il serait logique que vous puissiez installer deux transistors sur un processus 7 nm de la même taille qu'un transistor sur un processus 14 nm, mais ce n'est pas toujours vrai. Il y a beaucoup de surcharge, donc le nombre de transistors et donc la puissance de traitement ne s'adaptent pas vraiment à la taille de la technologie.
Source: IC Insights
Une autre mise en garde potentiellement plus importante est qu'il n'y a pas de système normalisé pour mesurer comme celui-ci. Toutes les grandes entreprises avaient l'habitude de mesurer de la même manière, mais maintenant elles ont divergé et chaque mesure d'une manière légèrement différente. Tout cela pour dire que la taille des caractéristiques d'une puce ne doit pas être une métrique principale lors d'une comparaison. Tant que deux puces sont à peu près dans une génération, la plus petite n'aura pas beaucoup d'avantage.
# 5 La comparaison du nombre de cœurs GPU est un moyen utile d'évaluer les performances
Lorsque l'on compare les processeurs aux GPU, la plus grande différence est le nombre de cœurs dont ils disposent. Les processeurs ont quelques cœurs très puissants, tandis que les GPU ont des centaines ou des milliers de cœurs moins puissants. Cela leur permet de traiter plus de travail en parallèle.
Tout comme le processeur quadricœur d'une entreprise peut avoir des performances très différentes d'un processeur quadricœur d'une autre entreprise, il en va de même pour les GPU. Il n'y a pas de bon moyen de comparer le nombre de cœurs GPU entre différents fournisseurs. Chaque fabricant aura une architecture très différente qui rend ce type de métrique presque dénué de sens.
Par exemple, une entreprise peut choisir moins de cœurs mais ajouter plus de fonctionnalités, tandis qu'une autre peut préférer plus de cœurs, chacun avec une fonctionnalité réduite. Cependant, comme pour les processeurs, une comparaison entre les GPU du même fournisseur et de la même famille de produits est parfaitement valable.
# 6 La comparaison des FLOP est un moyen utile d'évaluer les performances
Lors du lancement d'une nouvelle puce ou d'un supercalculateur haute performance, l'une des premières choses annoncées est le nombre de FLOP qu'elle peut générer. L'acronyme signifie opérations en virgule flottante par seconde et mesure le nombre d'instructions pouvant être exécutées par un système.
Cela semble assez simple, mais bien sûr, les fournisseurs peuvent jouer avec les chiffres pour que leur produit semble plus rapide qu'il ne l'est. Par exemple, calculer 1.0 + 1.0 est beaucoup plus facile que calculer 1234.5678 + 8765.4321. Les entreprises peuvent jouer avec le type de calculs et la précision associée pour gonfler leurs chiffres.
L'examen des FLOP ne mesure également que les performances de calcul CPU / GPU brutes et ignore plusieurs autres facteurs importants tels que la bande passante mémoire. Les entreprises peuvent également optimiser les benchmarks qu'elles utilisent pour favoriser injustement leurs propres pièces.
#7 ARM fabrique des puces
Presque tous les systèmes à faible consommation d'énergie et embarqués sont alimentés par une forme de processeur ARM. Ce qui est important à noter, c'est que ARM ne fabrique pas de puces physiques. Au contraire, ils conçoivent les plans du fonctionnement de ces puces et laissent d'autres entreprises les construire.
Par exemple, le SoC A13 du dernier iPhone utilise l'architecture ARM, mais a été conçu par Apple. C'est comme donner un dictionnaire à un auteur et lui demander d'écrire quelque chose. L'auteur a les éléments de base et doit adhérer à des directives sur la façon dont les mots peuvent être utilisés, mais ils sont libres d'écrire ce qu'ils veulent.
En octroyant une licence à leur propriété intellectuelle (IP), ARM permet à Apple, Qualcomm, Samsung et bien d'autres de créer leurs propres puces mieux adaptées à leurs propres besoins. Cela permet à une puce conçue pour un téléviseur de se concentrer sur le codage et le décodage multimédia, tandis qu'une puce conçue pour être intégrée à une souris sans fil se concentrera sur une faible consommation d'énergie.
La puce ARM de la souris n'a pas besoin d'un GPU ou d'un CPU très puissant. Étant donné que tous les processeurs basés sur ARM utilisent le même ensemble de base de conceptions et de plans, ils peuvent tous exécuter les mêmes applications. Cela facilite le travail du développeur et augmente la compatibilité.
# 8 ARM contre x86
ARM et x86 sont les deux architectures de jeu d'instructions dominantes qui définissent le fonctionnement et l'interaction du matériel informatique. ARM est le roi des systèmes mobiles et embarqués, tandis que x86 contrôle le marché des ordinateurs portables, des ordinateurs de bureau et des serveurs. Il existe d'autres architectures, mais elles servent plus d'applications de niche.
Lorsqu'on parle d'une architecture de jeu d'instructions, cela fait référence à la façon dont un processeur est conçu à l'intérieur. C'est comme traduire un livre dans une autre langue. Vous pouvez transmettre les mêmes idées, mais vous les écrivez simplement d'une manière différente. Il est tout à fait possible d'écrire un programme et de le compiler d'une manière pour s'exécuter sur un processeur x86 et d'une autre manière de s'exécuter sur ARM.
ARM s'est différencié de x86 de plusieurs manières clés, ce qui leur a permis de dominer le marché mobile. Le plus important est leur flexibilité et leur large gamme d'offres technologiques. Lors de la construction d'un processeur ARM, c'est presque comme si l'ingénieur jouait avec des Legos. Ils peuvent choisir les composants de leur choix pour créer le processeur parfait pour leur application. Besoin d'une puce pour traiter de nombreuses vidéos? Vous pouvez ajouter un GPU plus puissant. Besoin d'exécuter beaucoup de sécurité et de cryptage? Vous pouvez ajouter des accélérateurs dédiés. L'accent mis par ARM sur l'octroi de licences sur leur technologie plutôt que sur la vente de puces physiques est l'une des principales raisons pour lesquelles leur architecture est la plus largement produite. Intel et AMD ont en revanche stagné dans ce domaine, ce qui a créé le vide dont ARM a pris le contrôle.
Intel est le plus souvent associé à x86 et pendant qu'ils l'ont créé, les processeurs AMD exécutent la même architecture. Si vous voyez x86-64 mentionné quelque part, c'est juste la version 64 bits de x86. Si vous utilisez Windows, vous vous êtes peut-être demandé pourquoi il existe un "Program Files" et un "Program Files (x86)". Ce n'est pas que les programmes du premier dossier n'utilisent pas x86, c'est juste qu'ils sont 64 bits alors que les programmes dans "Program Files (x86)" sont 32 bits.
Un autre domaine qui peut prêter à confusion entre ARM et x86 concerne leurs performances relatives. Il est facile de penser que les processeurs x86 sont toujours plus rapides que les processeurs ARM et c'est pourquoi nous ne voyons pas de processeurs ARM dans les systèmes haut de gamme. Bien que cela soit généralement vrai (jusqu'à présent), ce n'est pas vraiment une comparaison juste et cela manque le point. Toute la philosophie de conception d'ARM est de se concentrer sur l'efficacité et la faible consommation d'énergie. Ils laissent x86 avoir le marché haut de gamme parce qu'ils savent qu'ils ne peuvent pas rivaliser là-bas. Alors qu'Intel et AMD se concentrent sur des performances maximales avec x86, ARM maximise les performances par Watt.
# 9 Les GPU sont des processeurs plus rapides que les CPU
Au cours des dernières années, nous avons constaté une augmentation considérable des performances et de la prévalence des GPU. De nombreuses charges de travail qui étaient traditionnellement exécutées sur un processeur ont été déplacées vers des GPU pour tirer parti de leur parallélisme. Pour les tâches comportant de nombreuses petites pièces pouvant être calculées en même temps, les GPU sont beaucoup plus rapides que les CPU. Ce n'est pas toujours le cas et c'est la raison pour laquelle nous avons encore besoin de processeurs.
Afin d'utiliser correctement un CPU ou un GPU, le développeur doit concevoir son code avec des compilateurs spéciaux et des interfaces optimisées pour la plate-forme. Les cœurs de traitement internes d'un GPU, qui peuvent être des milliers, sont très basiques par rapport à un CPU. Ils sont conçus pour les petites opérations qui se répètent encore et encore.
Les cœurs d'un processeur, par contre, sont conçus pour une très grande variété d'opérations complexes. Pour les programmes qui ne peuvent pas être parallélisés, un processeur sera toujours beaucoup plus rapide. Avec un compilateur approprié, il est techniquement possible d'exécuter du code CPU sur un GPU et vice-versa, mais le réel avantage ne vient que si le programme a été optimisé pour la plate-forme spécifique. Si vous ne regardez que le prix, les processeurs les plus chers peuvent coûter 50000 USD chacun, tandis que les GPU haut de gamme en sont moins de la moitié. En résumé, les processeurs et les GPU excellent tous les deux dans leurs propres domaines et aucun n'est nécessairement plus rapide que l'autre.
#dix Les processeurs seront toujours plus rapides
L'une des représentations les plus célèbres de l'industrie technologique est la loi de Moore. C'est une observation que le nombre de transistors dans une puce a pratiquement doublé tous les 2 ans. Il est exact depuis 40 ans, mais nous en sommes à la fin et la mise à l'échelle ne se fait plus comme avant.
Si nous ne pouvons pas ajouter plus de transistors aux puces, on pense que nous pourrions simplement les agrandir. La limitation ici est d'obtenir suffisamment de puissance pour la puce, puis d'éliminer la chaleur qu'elle génère. Les puces modernes consomment des centaines d'ampères de courant et génèrent des centaines de watts de chaleur.
Les systèmes de refroidissement et d'alimentation électrique d'aujourd'hui ont du mal à suivre et sont proches de la limite de ce qui peut être alimenté et refroidi. C'est pourquoi nous ne pouvons pas simplement fabriquer une plus grosse puce.
Si nous ne pouvons pas fabriquer une puce plus grande, ne pourrions-nous pas simplement rendre les transistors de la puce plus petits pour ajouter plus de performances? Ce concept est valable depuis plusieurs décennies, mais nous approchons d'une limite fondamentale de la façon dont les petits transistors peuvent obtenir.
Avec les nouveaux processus 7 nm et les futurs processus 3 nm, les effets quantiques commencent à devenir un énorme problème et les transistors cessent de se comporter correctement. Il y a encore un peu plus de place pour réduire, mais sans innovation sérieuse, nous ne pourrons pas aller beaucoup plus petit. Donc, si nous ne pouvons pas fabriquer des puces beaucoup plus grosses et que nous ne pouvons pas rendre les transistors beaucoup plus petits, ne pouvons-nous pas simplement faire fonctionner ces transistors existants plus rapidement? C'est encore un autre domaine qui a donné des avantages dans le passé, mais il est peu probable qu'il continue.
Alors que la vitesse du processeur a augmenté à chaque génération pendant des années, elle est restée bloquée dans la plage 3-5 GHz au cours de la dernière décennie. Cela est dû à une combinaison de plusieurs choses. De toute évidence, cela augmenterait la consommation d'énergie, mais le problème principal est encore une fois lié aux limitations des transistors plus petits et aux lois de la physique.
Au fur et à mesure que nous réduisons les transistors, nous devons également rendre les fils qui les relient plus petits, ce qui augmente leur résistance. Nous avons traditionnellement été en mesure d'accélérer les transistors en rapprochant leurs composants internes, mais certains sont déjà séparés par juste un atome ou deux. Il n'y a pas de moyen facile de faire mieux.
En réunissant toutes ces raisons, il est clair que nous ne verrons pas le type de mise à niveau des performances générationnelles du passé, mais soyez assuré qu'il y a beaucoup de gens intelligents qui travaillent sur ces problèmes.