Dans le document fondateur sur l’IA, intitulé Computing Machinery and Intelligence, Alan Turing a posé la célèbre question suivante : « Les machines peuvent-elles penser ? » – ou, plus précisément, les machines peuvent-elles réussir à imiter la pensée ?
70 ans plus tard, la réponse est toujours « non », car une machine n’a pas passé le test de Turing.
Turing précise qu’il s’intéresse aux machines qui « sont destinées à effectuer toutes les opérations qui pourraient être effectuées par un ordinateur humain ». En d’autres termes, il s’intéresse aux machines numériques complexes.
Puisque la réalisation d’une machine numérique pensante relève de l’évolution des machines, il a des raisons de commencer au début de l’histoire des machines.
Une machine est un dispositif qui effectue un travail. En termes d’ingénierie, le travail signifie le transfert d’énergie d’un objet à un autre. Les machines nous permettent d’appliquer plus de force, et/ou de le faire plus efficacement, ce qui entraîne une augmentation du travail effectué.
Les machines modernes – comme le robot de Boston Dynamics ci-dessus, Atlas – utilisent des centaines de pièces, y compris des joints hydrauliques, des pistons, des engrenages, des valves, et ainsi de suite pour accomplir des tâches complexes, comme la stabilisation autocorrective, ou même des backflips.
Machines simples
Cependant, les « machines simples » correspondent également à notre définition précédente, y compris les roues, les leviers, les poulies, les plans inclinés, les coins et les vis. En fait, toutes les machines mécaniques sont faites d’une combinaison de ces six machines simples.
L’atlas n’est pas seulement une machine mécanique, mais aussi une machine numérique.
Les machines mécaniques simples sont vieilles de millions d’années. Par exemple, « les outils de taille de pierre sont aussi vieux que la société humaine », et les archéologues ont trouvé des outils en pierre « d’il y a 1,5 à 2 millions d’années ».
Machines complexes
Des combinaisons de machines simples pourraient être utilisées pour fabriquer tout, d’une brouette à une bicyclette en passant par un robot mécanique.
En fait, les enregistrements de robots mécaniques remontent à plus de 3 000 ans.
Le texte taoïste Lieh-tzu, écrit au 5e siècle avant notre ère, comprend le récit d’une rencontre bien plus ancienne entre le roi Mu de la dynastie Zhou (1023-957 avant notre ère) et un ingénieur nommé Yen Shi. Yen Shi présenta au roi un automate mécanique de forme humaine, grandeur nature :
« Le roi fixa la figure avec étonnement. Elle marchait à pas rapides, bougeant la tête de haut en bas, de sorte que n’importe qui l’aurait prise pour un être humain vivant. L’artificier toucha son menton et elle se mit à chanter, en parfaite harmonie. Il toucha sa main, et elle se mit à prendre des postures, en gardant parfaitement le rythme… Alors que la représentation touchait à sa fin, le robot cligna de l’œil et fit des avances aux dames présentes, sur quoi le roi se fâcha et aurait fait exécuter Yen Shi sur le champ si ce dernier, dans une peur mortelle, n’avait pas instantanément mis le robot en pièces pour lui faire voir ce qu’il était vraiment. Et, en effet, il s’avéra n’être qu’une construction de cuir, de bois, de colle et de laque… »
Le roi demanda : « Se peut-il que l’habileté humaine soit à la hauteur de celle du grand Auteur de la Nature ? »
En d’autres termes, la question de Turing de savoir si les machines peuvent imiter les humains est en réalité vieille de plusieurs milliers d’années.
Au même moment, les scientifiques grecs créaient une large gamme d’automates. Archytas (vers 428-347 av. J.-C.) a créé un oiseau mécanique qui pouvait voler à quelque 200 mètres, décrit comme un appareil artificiel, propulsé par la vapeur, en forme d’oiseau.
« Archytas a fabriqué un modèle en bois d’une colombe avec une telle ingéniosité mécanique et un tel art qu’il a volé. »
Certains historiens modernes pensent qu’il a pu être aidé par une suspension à des fils, mais dans tous les cas, c’était une tentative claire de créer une machine.
Un autre scientifique grec, Dédale, a créé des statues qui bougeaient :
« Dédale aurait créé des statues si réalistes qu’elles pouvaient bouger d’elles-mêmes. »
Le « premier coucou » a été décrit dans le livre The Rise and Fall of Alexandria : Birthplace of the Modern World (page 132):
« Bientôt, les horloges de Ctésibius furent étouffées par des robinets d’arrêt et des soupapes, contrôlant une foule de dispositifs allant des cloches aux marionnettes en passant par des colombes mécaniques qui chantaient pour marquer le passage de chaque heure – le tout premier coucou ! »
Au fil des siècles, des engins de plus en plus complexes furent utilisés pour créer des automates, comme des machines mobiles actionnées par le vent.
Machines mécaniques complexes programmables
Il a fallu attendre le 9e siècle de notre ère pour que la première machine mécanique complexe programmable enregistrée :
« La plus ancienne conception connue d’une machine programmable est le joueur de flûte automatique qui a été décrit au 9e siècle par les frères Musa à Bagdad. »
Il a également été décrit comme « l’instrument qui joue lui-même ». Un livre sur ces appareils est conservé à la bibliothèque du Vatican.
Machines à calculer mécaniques
Une autre étape sur le long chemin vers l’IA moderne a été la création de calculatrices mécaniques.
La première calculatrice mécanique a été construite par Wilhelm Schickard dans la première moitié du 17ème siècle, permettant l’addition et la multiplication.
La calculatrice mécanique suivante, construite par Blaise Pascal, pouvait également effectuer des soustractions.
Ces machines ont inspiré des penseurs comme Gottfried Wilhelm Leibniz à considérer l’idée suivante :
« Si chaque domaine de l’expérience humaine peut être compris au moyen de la pensée mathématique et si la pensée est une forme de calcul et que le calcul peut être mécanisé, alors toutes les questions sur la réalité peuvent, en principe, être répondues au moyen d’un calcul exécuté par une machine. »
À bien des égards, cela ressemble à notre concept d’intelligence générale artificielle aujourd’hui.
L’idée de Leibniz était qu’une characteristica universalis, ou un programme logique universel, pourrait alors répondre à toutes les questions sur la réalité.
Machines à calculer programmables
En 1833, Charles Babbage a combiné l’innovation du 9e siècle des machines programmables et celle du 17e siècle des machines à calculer pour concevoir un Analytical Engine : Une machine à calculer programmable.
Babbage n’a jamais réussi à construire une machine complète, mais sa « technique des cartes perforées » a été utilisée plus tard dans les premières machines numériques.
Machines numériques (ordinateurs)
Le passage des ordinateurs mécaniques aux ordinateurs numériques a été un saut massif pour arriver là où nous sommes aujourd’hui.
À la fin des années 30 et dans les années 40, plusieurs ordinateurs numériques ont émergé, se disputant la place de « premier ordinateur numérique ».
L’ENIAC est largement considéré comme le premier ordinateur numérique, dont la construction s’est achevée en 1946, car c’était le premier qui était pleinement fonctionnel.
Les autres ordinateurs numériques comprenaient le Colossus en 1943, qui a aidé les casseurs de code britanniques à lire les messages allemands cryptés, et l’ordinateur ABC en 1942.
À partir de là, le progrès s’est rapidement accéléré, avec des avancées telles que le stockage des programmes en mémoire, la RAM, les graphiques en temps réel et les transistors étant libérés dans une succession relativement rapide.
L’apprentissage des machines
Enfin, avec l’avènement des machines numériques complexes, nous pouvons aborder le sujet de l’apprentissage des machines.
Comme exploré au début, l’essor des machines a incité Alan Turing à demander, en 1950, « les machines peuvent-elles penser ? ». Cinq ans plus tard, Dartmouth publiait un article fondateur sur l’IA, et les principes fondamentaux du domaine sont restés similaires depuis lors.
En 1955, M.L. Minsky écrivait :
Une « machine peut être « entraînée » par un processus « d’essais et d’erreurs » pour acquérir l’une d’une gamme de fonctions d’entrée-sortie. Une telle machine, lorsqu’elle est placée dans un environnement approprié et qu’on lui donne un critère de « succès » ou d' »échec », peut être entraînée à présenter un comportement de « recherche de but ». »
En d’autres termes, les algorithmes d’apprentissage automatique construisent des modèles mathématiques sur des « données d’entraînement » pour prendre des décisions, sans être explicitement programmés pour prendre ces décisions.
C’est la différence clé entre une calculatrice et l’apprentissage automatique (ou IA) : Une calculatrice, ou toute forme d’automate, a une sortie prédéterminée. L’IA prend des décisions probabilistes à la volée.
Une machine mécanique a également des limites physiques beaucoup plus strictes, en termes de nombre de composants de la machine (par exemple, des poulies, des leviers, des engrenages) qui peuvent être adaptés dans un engin, tandis que l’unité centrale d’une machine numérique moderne peut contenir des milliards de transistors.
L’expression réelle « apprentissage automatique » a été inventée par Arthur Samuel en 1952, après qu’il ait développé un programme informatique pour jouer aux dames en utilisant l’apprentissage par cœur.
En 1957, Frank Rosenblatt crée le perceptron Mark I – un algorithme d’apprentissage supervisé de classificateurs binaires – dans le but de reconnaître des images.
Après avoir présenté ses travaux à la marine américaine en 1958, le New York Times rapporte :
Le perceptron est « l’embryon d’un ordinateur électronique qui, selon les prévisions, sera capable de marcher, de parler, de voir, d’écrire, de se reproduire et d’être conscient de son existence. »
Même en 1958, les chercheurs prévoyaient un jour une IA sensible.
Les réalisations ultérieures comprennent les réseaux neuronaux à anticipation (comme un perceptron, mais avec plusieurs couches), l’algorithme du plus proche voisin en 67, la rétropropagation sur ordinateur dans les années 70 (qui est maintenant utilisée pour entraîner les réseaux neuronaux profonds), les algorithmes de boosting au début des années 90, et les LSTM en 97.
Améliorations dues aux données et à la puissance de calcul
Dans le récent cours sur l’IA d’Andrew Ng, un éminent chercheur en IA, il note qu’il n’y a eu « presque aucun progrès » dans l’intelligence générale artificielle, mais que des progrès incroyables ont été réalisés dans l' »intelligence étroite » – des fonctions d’entrée-sortie « qui font une seule chose, comme un haut-parleur intelligent ou une voiture à conduite autonome. »
À un haut niveau, l’IA consiste toujours à « apprendre une fonction qui fait correspondre x à y. »
Les incroyables progrès que nous avons vus récemment sont principalement dus à une explosion des données et de la puissance de calcul, parallèlement à de meilleures données (de meilleure qualité) et à davantage d’ingénieurs en IA.
Plus de données et de puissance de calcul augmentent naturellement la précision de la plupart des modèles d’IA, en particulier dans l’apprentissage profond.
La démocratisation de l’IA
A côté de l’évolution des architectures d’IA, de la puissance de calcul et des données, l’IA s’est récemment imposée dans l’industrie, grâce à la prolifération d’outils d’IA plus accessibles.
L’émergence d’outils rendant les technologies plus accessibles a une longue histoire. Par exemple, la presse à imprimer de Gutenberg a démocratisé le savoir au 15e siècle.