Linux-Team - Information Technology Forum - Ελληνικό Τεχνολογικό Φόρουμ


Μη Συνδεδεμενος Παρακαλώ συνδεθείτε ή εγγραφείτε

 Εφαρμογή ερευνητών της Google "διαβάζει" που τραβήχτηκε μια φωτογραφία

Επισκόπηση προηγούμενης Θ.Ενότητας Επισκόπηση επόμενης Θ.Ενότητας Πήγαινε κάτω  Μήνυμα [Σελίδα 1 από 1]

Δημοσίευση #1
 Christiana

Christiana
Forum Moderator
Forum Moderator
[Πρέπει να είστε εγγεγραμμένοι και συνδεδεμένοι για να δείτε αυτή την εικόνα.]

Ωραία είναι αυτή η φωτογραφία, αλλά που στο καλό τραβήχτηκε; Σε αυτό το συχνό ερώτημα, που οι άνθρωποι δυσκολεύονται να απαντήσουν, μια νέα εφαρμογή, την οποία δημιούργησαν τρεις ερευνητές της Google, τα καταφέρνει πολύ καλύτερα, «διαβάζοντας» πιο σωστά το τοπίο.

Η εφαρμογή βρίσκεται ακόμη σε στάδιο ανάπτυξης και δεν έχει κυκλοφορήσει προς χρήση.

Οι ερευνητές, με επικεφαλής τον Τομπάιας Γουέιαντ, ανέπτυξαν ένα λογισμικό «βαθιάς μάθησης», το οποίο κάνει γεωεντοπισμό της φωτογραφίας, χρησιμοποιώντας μόνο πληροφορίες από τα εικονοστιχεία (πίξελ) της.

Εκ πρώτης όψεως φαντάζει δύσκολο έως αδύνατο να καταλάβει κανείς που τραβήχτηκε μια φωτογραφία, χωρίς να έχει άλλες πληροφορίες πέρα από την ίδια την εικόνα. Μερικές φορές οι άνθρωποι χρησιμοποιούν ενδείξεις, όπως ο καιρός, τα φυτά, διάφορα αντικείμενα κ.α. που φαίνονται στη φωτογραφία, για να βγάλουν συμπεράσματα – άλλες φορές με επιτυχία και άλλες όχι. Υπάρχουν και σχετικοί διαδικτυακοί τόποι όπως το GeoGuessr και το View from your Window, όπου οι χρήστες δοκιμάζουν τις ικανότητές τους.

Οι ερευνητές ακολούθησαν μια τελείως διαφορετική μέθοδο υπολογιστικής όρασης. Τοποθέτησαν ένα πλέγμα πάνω σε ένα ψηφιακό κόσμο, χωρίζοντας έτσι την επιφάνεια του πλανήτη σε χιλιάδες τετραγωνάκια διαφορετικών μεγεθών, ανάλογα με το πόσες φωτογραφίες τραβιούνται στην πραγματικότητα (π.χ. σε μια πόλη όπως η Νέα Υόρκη τραβιούνται πολύ περισσότερες φωτογραφίες από ό,τι σε μια έρημο, άρα το τετραγωνάκι της μεγαλούπολης είναι μεγαλύτερο).

Στη συνέχεια, τροφοδότησαν το λογισμικό τους με εκατομμύρια αποθηκευμένες φωτογραφίες, που συνοδεύονταν από πληροφορίες γεωεντοπισμού. Ακολούθως, το πρόγραμμα, που διαθέτει νευρωνική νοημοσύνη, δημιούργησε συσχετίσεις και αντιστοιχίες ανάμεσα στα πίξελ των εικόνων και στα τα μέρη όπου τραβήχτηκαν οι φωτογραφίες.

Τελικά, η εφαρμογή δοκιμάσθηκε με 2,3 εκατομμύρια φωτογραφίες από το Flickr. Όπως διαπιστώθηκε, κατάφερε να «πέσει μέσα» σε ποσοστό 48% όσον αφορά την ήπειρο που τραβήχτηκε μια φωτογραφία, 28,4% όσον αφορά τη συγκεκριμένη χώρα, 10,1% για την πόλη όπου έγινε η λήψη της φωτογραφίας και 3,6% για τον συγκεκριμένο δρόμο της πόλης.

Ίσως τα ποσοστά αυτά να μην φαίνονται εντυπωσιακά, αλλά ένας άνθρωπος δεν μπορεί να τα καταφέρει τόσο καλά, όταν βλέπει μια φωτογραφία που έχει τραβηχτεί κάπου στη Γη. Αυτό αποδείχθηκε, όταν οι τρεις ερευνητές αντιπαράθεσαν την εφαρμογή τους με τις επιδόσεις δέκα ανθρώπων σε ένα πείραμα.

Το επόμενο βήμα για τη βελτίωση της εφαρμογής θα είναι η ενσωμάτωση της ικανότητας να αναγνωρίζει αντικείμενα και άλλα γνωρίσματα (χρώμα δέρματος ανθρώπων, αρχιτεκτονική κτιρίων, είδος δέντρων, πινακίδες οδικής κυκλοφορίας κ.α.) και να τα συσχετίζει με συγκεκριμένες τοποθεσίες.

[Πρέπει να είστε εγγεγραμμένοι και συνδεδεμένοι για να δείτε αυτόν το σύνδεσμο.]

[Πρέπει να είστε εγγεγραμμένοι και συνδεδεμένοι για να δείτε αυτόν το σύνδεσμο.]

Επισκόπηση προηγούμενης Θ.Ενότητας Επισκόπηση επόμενης Θ.Ενότητας Επιστροφή στην κορυφή  Μήνυμα [Σελίδα 1 από 1]


Δικαιώματα σας στην κατηγορία αυτή
Δεν μπορείτε να απαντήσετε στα Θέματα αυτής της Δ.Συζήτησης

Ωχ! Φαίνεται ότι κάτι πήγε στραβά ...

[#10425]

Ο διαχειριστής έχει μπλοκάρει την προβολή των θεμάτων στους επισκέπτες, μόνο τα μέλη μπορούν να δουν αυτό το πεδίο.


Χρήσιμοι Σύνδεσμοι: