Η αναστροφή της τεχνητής νοημοσύνης αναγνώρισης εικόνων της Google παράγει μερικές εκπληκτικά ασυνήθιστες εικόνες

Besykje Ús Ynstrumint Foar It Eliminearjen Fan Problemen

Η τεχνολογία αναγνώρισης εικόνας είναι πολύ ισχυρό πράγμα. Επιτρέπει στο Facebook να προσθέτει αυτόματα ετικέτες σε φωτογραφίες του φίλου σας, το Google Images να σας δείχνει φωτογραφίες που μοιάζουν με μια φωτογραφία που έχετε ήδη και τα αυτοκινούμενα αυτοκίνητα αναγνωρίζουν τους πεζούς πριν τους χτυπήσουν. Επίσης, είναι πολύ σημαντικό, που επιτρέπει στην Google να δημιουργήσει αριστουργήματα όπως αυτό:

trippy google εικόνα

Mike Tyka / Google

Alexander Mordvintsev, Christopher Olah και Mike Tyka , τρεις μηχανικοί λογισμικού της Google, εξηγούν στο ερευνητικό ιστολόγιο της εταιρείας ότι η παραπάνω εικόνα προέρχεται από το γύρισμα ενός «τεχνητό νευρωνικό δίκτυο» — ένα είδος συστήματος τεχνητής νοημοσύνης που αντικατοπτρίζει τη δομή των βιολογικών νευρικών συστημάτων — που κάνει αναγνώριση εικόνων. Αντί να τραβήξει μια εικόνα και να προσπαθήσει να δει ποια αντικείμενα περιέχονται μέσα σε αυτήν, το αναποδογυρισμένο νευρωνικό δίκτυο παίρνει μια εικόνα και προσπαθεί να τη «δει» με τέτοιο τρόπο ώστε να εμφανιστεί ένα αντικείμενο για το οποίο ήδη γνωρίζει. Η παραπάνω φωτογραφία ήταν το αποτέλεσμα της τροφοδοσίας τυχαίου θορύβου σε ένα νευρωνικό δίκτυο εκπαιδευμένο να αναγνωρίζει «μέρη».

Μπορούν επίσης να βρουν πιο συγκεκριμένα πράγματα. Αυτό συνέβη όταν ζήτησαν από το νευρωνικό δίκτυο να βρει μια μπανάνα σε ένα σωρό εικονοστοιχεία χωρίς νόημα:

θόρυβος μπανάνας

Mike Tyka / Google

Πολύ ωραίο, ε; Ακολουθούν μερικές ακόμη φωτογραφίες που δημιουργήθηκαν χρησιμοποιώντας το ίδιο δίχτυ αναγνώρισης θέσεων με την επάνω εικόνα:

trippy google

Mike Tyka / Google

trippy google

Mike Tyka / Google

google trippy

Mike Tyka / Google

trippy google

Mike Tyka / Google

Μπορείτε επίσης να στείλετε αναπαραστατικές εικόνες μέσω δικτύων που έχουν εκπαιδευτεί να αναγνωρίζουν διαφορετικά είδη εικόνων, δημιουργώντας έτσι μια νέα εικόνα που τα συνδυάζει και τα δύο. Για παράδειγμα, εδώ είναι μια εικόνα ενός ιππότη όπως ερμηνεύεται από ένα νευρωνικό δίκτυο εκπαιδευμένο να αναγνωρίζει ζώα. Το τελικό αποτέλεσμα είναι ένας ιππότης που έχει μεταμορφωθεί σε μια χίμαιρα πολλών σκύλων:

google trippy

Mike Tyka / Google

Τα νευρωνικά δίκτυα αναγνώρισης εικόνας «αναστροφής» είναι σημαντικό για την κατανόηση του πώς ακριβώς αναγνωρίζουν αντικείμενα. Εάν θέλετε ένα νευρωνικό δίχτυ να αναγνωρίζει τους αλτήρες, για παράδειγμα, μπορείτε να του στείλετε ένα σωρό εικόνες ανθρώπων που κάνουν μπούκλες χεριών με αλτήρες. Στην ιδανική περίπτωση, τα δίχτυα θα παρατηρήσουν απλώς τα βάρη. Αλλά μερικές φορές, όπως στην περίπτωση ενός νευρωνικού δικτύου της Google, μαζεύουν πάρα πολλά και πιστεύουν ότι όλοι οι αλτήρες πρέπει να έχουν μυώδεις βραχίονες:

νευρωνικά δίχτυα αλτήρες

Google

Αναστρέφοντας αυτό το νευρωνικό δίκτυο, η Google έμαθε ότι υπήρχε ένα μεγάλο ελάττωμα στον τρόπο αναγνώρισης των αλτήρων, το οποίο στη συνέχεια θα μπορούσε να διορθώσει για να βελτιώσει τις δυνάμεις αναγνώρισης του δικτύου. Οπως και ο Άλεξ Χερν του Guardian Σημειώνει, σε αυτό το παράδειγμα, μπορεί να τους δώσει λόγο να τροφοδοτήσουν τις εικόνες του δικτύου με αλτήρες που κάθονται ακίνητοι στο έδαφος, έτσι ώστε το δίχτυ να διαχωρίζει την έννοια των αλτήρων από τα μπράτσα των ανθρώπων που τους κρατούν.

Ακολουθούν μερικές ακόμη διασκεδαστικές ψηφιακές παραισθήσεις που έχουν δημιουργήσει τα νευρωνικά δίκτυα της Google:

Μια εικόνα ενός κόκκινου δέντρου, με ζώα και μέρη αναγνωρισμένα.

Mike Tyka / Google

Φιλτραρισμένος ορίζοντα του Σιάτλ.

Mike Tyka / Google

Addax, στρεβλό

Μια φωτογραφία λευκών αντιλόπες (addax), πριν και μετά το φιλτράρισμα από ένα νευρωνικό δίχτυ που αναγνωρίζει τις άκρες.

Αριστερά: Πρωτότυπη φωτογραφία από Ζαχή Έβενορ . Δεξιά: επεξεργασία από τον Günther Noack, Μηχανικό Λογισμικού. Μέσω

Τα σύννεφα διασχίζουν ένα νευρωνικό δίκτυο που αναγνωρίζει ζώα.

Google

Χάρη σε Χερν στον Guardian για τον δείκτη.