Σας φέρνουν λίγο πιο κοντά στις μηχανές;  – Βιβόκα

Σας φέρνουν λίγο πιο κοντά στις μηχανές; – Βιβόκα

November 30, 2022 0 Von admin

Όταν προσεγγίζετε το πεδίο της αλληλεπίδρασης ανθρώπου-μηχανής (HMI), ειδικά με προσωπικούς βοηθούς, είναι σημαντικό να λαμβάνεται υπόψη μια πιο «σχεσιακή» διάσταση. Οι διάφορες τεχνολογίες αναγνώρισης ομιλίας, μεταξύ πολλών άλλων καινοτομιών, βελτιώνουν συνεχώς τις λειτουργίες τους για να προωθήσουν την υιοθέτησή τους από το κοινό. Επομένως, το να μιλάς με έναν φωνητικό βοηθό θα πρέπει να είναι εξίσου φυσικό με το να μιλάς σε έναν άνθρωπο. Από αυτή την παρατήρηση πρόκειται να σας παρουσιάσουμε αυτό που εμείς, και πολλοί ειδικοί, θεωρούμε ότι είναι ένα από τα βασικά στοιχεία αυτών των νέων τεχνολογιών: ομιλία προς συναίσθημα.

Αναγνώριση συναισθημάτων, το επόμενο βήμα στη σχέση ανθρώπου-μηχανής.

Σήμερα, οι βοηθοί φωνής, όπως και άλλες τεχνολογίες στον τομέα, κερδίζουν έδαφος μεταξύ διαφορετικών στόχων. Μέσω πολυάριθμων λειτουργιών που, από τη φύση τους, είναι πιο εύκολες και πιο εύχρηστες για τον χρήστη, αυτά τα νέα εργαλεία μετακινούνται από ένα «Ωραίο» σε ένα αληθινό «Μουσικό» σε πολλούς τομείς. Ωστόσο, σύμφωνα με τη Sophie Kleber, την εκτελεστική διευθύντρια του Huge, αυτό απέχει πολύ από το να είναι αρκετό για να απελευθερώσει το πλήρες δυναμικό της συνομιλίας ανθρώπου/μηχανής.

Σε ένα συνέδριο με τίτλο «Σχεδιάζοντας συναισθηματικά ευφυείς μηχανές», παρουσιάζει το όραμά της για την έλευση του τρόπου φωνητικής αλληλεπίδρασης, διευκρινίζοντας παράλληλα ότι αυτό θα συνδυαστεί με την εμφάνιση Συναισθηματικός Υπολογισμός. Δηλαδή, για να δημιουργήσουν ισχυρές σχέσεις με τους ανθρώπους, τα συστήματα θα πρέπει να είναι σε θέση να αναγνωρίζουν, να ερμηνεύουν, να χρησιμοποιούν και να προσομοιώνουν συναισθήματα.

Αυτό το όραμα μοιράζονται επίσης πολλοί ειδικοί στον τομέα, συμπεριλαμβανομένου του Viktor Rogzik, ερευνητή στο τμήμα Alexa Speech Group της Amazon: «Η συναισθηματική αναγνώριση είναι ένα όλο και πιο δημοφιλές ερευνητικό θέμα στον τομέα της τεχνητής νοημοσύνης αφιερωμένο στη συνομιλία. Η ανάπτυξη της τεχνολογίας ομιλίας θα περιλαμβάνει αναπόφευκτα τη συναισθηματική διάσταση, η πρώτη δουλειά σε αυτόν τον τομέα έχει ήδη γίνει, αλλά αυτό που αποτελεί την τελευταία λέξη της τέχνης έχει ακόμη πολύ δρόμο να διανύσει. Εξηγούμε γιατί.

Συναίσθημα, γιατί είναι τόσο δύσκολο να το εκμεταλλευτείς;

Όπως συμβαίνει με πολλές γνωστικές τεχνολογίες (που βασίζονται στη λειτουργία του ανθρώπινου εγκεφάλου), είναι πολύ δύσκολο να αναπαραχθούν αποτελεσματικά ορισμένες πολύπλοκες διαδικασίες. Πράγματι, η γλώσσα και η διερμηνεία είναι δύο τομείς με αμέτρητες εξαιρέσεις και ιδιαιτερότητες. Για παράδειγμα, η ειρωνεία ή άλλες τεχνοτροπίες, όπως οι ευφημισμοί, αλλάζουν το πραγματικό νόημα μιας πρότασης και απαιτούν κάποια πολύ συμφραζόμενη ερμηνεία. Έτσι, οι μικροεκφράσεις, οι φωνητικές διαμορφώσεις κ.λπ. είναι όλα στοιχεία που πρέπει να λαμβάνονται υπόψη προκειμένου να κατανοηθούν πλήρως οι προθέσεις, συνειδητές ή μη, των χρηστών. Πρέπει να γίνει κατανοητό με αυτή την έννοια ότι το να βασίζεται κανείς μόνο σε λέξεις είναι πολύ μεγάλο λάθος, αυτό που έγινε στις πρώτες εργασίες για το θέμα (όπου ένας απλός θετικός ή αρνητικός συντελεστής αποδόθηκε ανάλογα με τη σημασία των λέξεων).

Υπάρχουν και άλλα εμπόδια όπως:

  • Τα συναισθήματα είναι υποκειμενικά, η ερμηνεία τους μπορεί να ποικίλλει πολύ. Είναι πράγματι πολύ δύσκολο να ορίσεις πραγματικά ένα συναίσθημα.
  • Τι πρέπει να λαμβάνεται υπόψη για την αναγνώριση ενός συναισθήματος; Το νόημα μιας λέξης, ενός συνόλου λέξεων ή μιας ολόκληρης συνομιλίας;
  • Η συλλογή δεδομένων είναι πολύ περίπλοκη. Υπάρχουν πολλά, ακόμη και τεράστια ποσά, ωστόσο είναι δύσκολο να βρει κανείς αξιόπιστα δεδομένα για τα συναισθήματα. Για παράδειγμα, οι τηλεοπτικές ειδήσεις παρουσιάζονται με ουδέτερο τρόπο που δεν προσφέρει θεραπεύσιμα δεδομένα, οι ηθοποιοί μιμούνται συναισθήματα που δημιουργεί μεροληψία στην ταύτιση.

Πώς να επωφεληθείτε από το Speech to Emotion;

Αυτό είναι σίγουρα το κομμάτι που σας ενδιαφέρει περισσότερο και το πιο ρεαλιστικό! Πρώτα απ ‚όλα, είναι ένα χαρακτηριστικό που αναμένεται να είναι απαραίτητο για το μέλλον των φωνητικών βοηθών! «Πιστεύουμε ότι στο μέλλον, όλοι οι χρήστες μας θα θέλουν να αλληλεπιδρούν με τους βοηθούς με συναισθηματικό τρόπο. Αυτή είναι η τάση που βλέπουμε μακροπρόθεσμα», δήλωσε ο Felix Zhang, Αντιπρόεδρος Μηχανικής Λογισμικού της Huawei. CNBC.

Αύριο, θα είναι δυνατή η σύζευξη μηχανών Speech-to-Emotion (STE) με συστήματα επεξεργασίας φυσικής γλώσσας (NLP) για την πραγματική αναγνώριση και ερμηνεία των συναισθημάτων σε μια συνομιλία ή ομιλία. Αυτό ανοίγει ένα πολύ ευρύ πεδίο εφαρμογών! Για παράδειγμα, θα είναι δυνατή η περαιτέρω εξατομίκευση των υπηρεσιών στον χρήστη ανάλογα με τα συναισθήματα που νιώθει. Τι καλύτερος τρόπος για να βελτιώσετε την εμπειρία από το να προσαρμόσετε το αποτέλεσμα σύμφωνα με αυτό που νιώθει ο χρήστης;

Μιλάμε πολύ για το τι μπορεί να προσφέρει η φωνή σε επίπεδο εμπειρίας. Για την εκμετάλλευση αυτής της διάστασης, υπάρχουν περισσότερα από τη φωνή του χρήστη. Είστε εξοικειωμένοι με το TTS (Text-to-Speech); Αυτές είναι μηχανές σύνθεσης ομιλίας που σας επιτρέπουν να δημιουργείτε σχεδόν ανθρώπινες φωνές από κείμενο. Η φωνή του SNCF ή του RATP έρχεται από εκεί! Για να δημιουργήσετε μια σύνδεση με αυτό που λέγαμε πριν, η χρήση ενός TTS εξατομικευμένου σύμφωνα με το συναίσθημα που προσδιορίστηκε είναι ένα επιπλέον κομμάτι σε μια σύνδεση Ανθρώπου-Μηχανής που αναπτύχθηκε.

Το μέλλον των φωνητικών συστημάτων έγκειται επομένως στην αναγνώριση συναισθημάτων. Αυτός ο τύπος συναισθηματικής νοημοσύνης είναι στο δρόμο του να φέρει τον άνθρωπο ακόμα πιο κοντά στη μηχανή. Ωστόσο, πρόκειται για χειραγώγηση προσωπικών δεδομένων. Επομένως, το φωνητικό προφίλ πρέπει να παραμείνει με σκοπό τη βελτίωση της εμπειρίας και την καλύτερη τήρηση των κατευθυντήριων γραμμών του RGPD και άλλων αρχών προστασίας της ιδιωτικής ζωής.