Ειδησεογραφικοί οργανισμοί κατηγορούν την Perplexity για λογοκλοπή και αθέμιτη συλλογή πληροφοριών από το διαδίκτυο

nchatz · 3 Ιουλίου

To θολό τοπίο γύρω από τους νόμους προστασίας της πνευματικής ιδιοκτησίας και τα bot που σαρώνουν το διαδίκτυο για τη συλλογή δεδομένων περιπλέκει την όλη κατάσταση.

Η Perplexity AI, εταιρία η οποία συνδυάζει μηχανές αναζήτησης με μεγάλα γλωσσικά μοντέλα, έχει έρθει αντιμέτωπη με κατηγορίες για την εφαρμογή αθέμιτων πρακτικών ως προς τον τρόπο που δραστηριοποιείται. Η εταιρία, στην οποία έχουν επενδύσει μεταξύ άλλων η Nvidia και ο Τζεφ Μπέζος, σχηματίζει λεπτομερείς απαντήσεις στα ερωτήματα που δέχεται χρησιμοποιώντας μοντέλα τεχνητής νοημοσύνης είτε ανοιχτού κώδικα, είτε εμπορικά διαθέσιμα.

Τον Ιούνιο, το Forbes κατηγόρησε την Perplexity ότι υφάρπαξε άρθρο το οποίο είχε δημοσιευτεί στην ιστοσελίδα του, ενσωματώνοντάς το στη beta έκδοση της λειτουργίας Perplexity Pages. Αντίστοιχα, το Wired υποστήριξε ότι η Perplexity παράνομα συνέλεξε στοιχεία από την ιστοσελίδα του, καθώς και άλλες ιστοσελίδες, αδιαφορώντας για το πλαίσιο που ορίζει το Πρωτόκολλο Αποκλεισμού Ρομπότ. Το πρωτόκολλο αυτό είναι το πρότυπο που εφαρμόζεται από διάφορες ιστοσελίδες προκειμένου να καθιστούν σαφές ότι δεν επιθυμούν να αποκτούν πρόσβαση στο περιεχόμενό τους τα λεγόμενα web crawlers, δηλαδή bots που συλλέγουν διαρκώς πληροφορίες από το διαδίκτυο.

Από την πλευρά της, η Perplexity υποστηρίζει ότι οι κατηγορίες είναι αβάσιμες, επισημαίνοντας ότι σέβεται τα αιτήματα των διαφόρων εκδοτών να μη συλλέγεται αυτόματα το περιεχόμενο που δημιουργούν, ενώ λειτουργεί εντός του πλαισίου που ορίζουν οι νόμοι περί δίκαιης χρήσης περιεχομένου προστατευόμενου από την πνευματική ιδιοκτησία. Η εταιρία υποστηρίζει ότι η δημιουργία της περίληψης ενός URL δεν είναι το ίδιο με το λεγόμενο crawling, καθώς απαντά σε ένα συγκεκριμένο αίτημα χρήστη και δεν συλλέγει αδιακρίτως δεδομένα.

Το Wired γνωστοποίησε ότι εντόπισε μηχανή συνδεδεμένη με την Perplexity να κινείται σε περιοχές ιστοσελίδων στις οποίες οι εκδότες δεν επιθυμούν να έχουν πρόσβαση τα διάφορα bot. Σε συνεργασία με το developer Ρομπ Νάιτ, το Wired θέλησε να επιβεβαιώσει το τι συνέβαινε, ζητώντας από την Perplexity να δημιουργήσει περιλήψεις συγκεκριμένων URL, οπότε διαπιστώθηκε ότι διεύθυνση IP η οποία συνδέεται με την Perplexity επισκέφτηκε τις επίμαχες ιστοσελίδες.

Εντωμεταξύ, οι κατηγορίες φτάνουν στο επίπεδο της λογοκλοπής. Το Wired ισχυρίζεται ότι η Perplexity υφάρπαξε το άρθρο στο οποίο η εταιρία καταγγελλόταν για αθέμιτη υφαρπαγή περιεχομένου. Για λογοκλοπή κατηγορεί την Perplexity και το Forbes, υποστηρίζοντας ότι υφάρπαξε το αποκλειστικό ρεπορτάζ σχετικά με το πρόγραμμα ανάπτυξης πολεμικών drones βασισμένων σε τεχνητή νοημοσύνη που εξελίσσει ο Έρικ Σμιντ, άλλοτε διευθύνων σύμβουλος της Google.

Ο Άρβιντ Σρίνιβας, διευθύνων σύμβουλος της Perplexity, απάντησε λέγοντας ότι η εταιρία θα φρόντιζε ώστε να παρατίθεται οι πηγές μιας απάντησης με σαφέστερο τρόπο στο μέλλον. Πάντως, η εταιρία σε γενικές γραμμές επιμένει ότι δικαιούται να χρησιμοποιεί αυτού του είδους το περιεχόμενο για τη δημιουργία περιλήψεων, στο πλαίσιο των νόμων περί δίκαιης χρήσης.

Την ίδια ώρα, νομικοί επισημαίνουν ότι η κατάσταση δεν είναι και τόσο απλή. Σε περίπτωση που μια τέτοια υπόθεση κατέληγε στα δικαστήρια, το ζήτημα προς εξέταση θα ήταν σε ποιο βαθμό χρησιμοποιούνται οι πρωτότυπες διατυπώσεις ή απλά οι ιδέες που περιγράφονται στα επίμαχα άρθρα και επίσης κατά πόσο η περίληψη θα συνέβαλε στην ανάγνωση του πρωτότυπου άρθρου.

Προκειμένου να προστατευτεί έναντι τυχόν προσφυγών και, ενδεχομένως, να κατευνάσει τους εκδότες, η Perplexity εξετάζει συμφωνίες διαμοιρασμού των διαφημιστικών εσόδων. Η εταιρία σχεδιάζει να συμπεριλάβει διαφημίσεις στις απαντήσεις των ερωτημάτων και να μοιράζεται τα έσοδα με τους εκδότες, το περιεχόμενο των οποίων παρατίθεται στις απαντήσεις.

Το ζήτημα που προέκυψε έρχεται να υπενθυμίσει τις συνεχιζόμενες εντάσεις μεταξύ των εταιριών τεχνητής νοημοσύνης και των δημιουργών περιεχομένου. Καθώς τα συστήματα τεχνητής νοημοσύνης εξελίσσονται σε επίπεδο δημιουργίας περιλήψεων και αξιοποίησης υφιστάμενου περιεχομένου, εκφράζονται ανησυχίες σχετικά με την ενδεχόμενη επίδραση που θα είχε αυτό στη δυνατότητα των εκδοτών να εκμεταλλεύονται εμπορικά το έργο τους. Η κατάσταση όπως διαμορφώνεται τώρα θα μπορούσε να οδηγήσει σε περιορισμό της δημιουργίας πρωτότυπου περιεχομένου, εν δυνάμει υποχρεώνοντας τα συστήματα τεχνητής νοημοσύνης να βασίζονται όλο και περισσότερο σε συνθετικά δεδομένα, εξέλιξη που θα μπορούσε να εισαγάγει μεροληπτικές προσεγγίσεις και ανακρίβειες στο υλικό από όπου εξάγονται οι απαντήσεις στα ερωτήματα των χρηστών.

Η όλη κατάσταση με την Perplexity αναδεικνύει τις σύνθετες προκλήσεις στις οποίες καλείται να δώσει απαντήσεις η βιομηχανία τεχνητής νοημοσύνης, οι δημιουργοί περιεχομένων αλλά και οι ρυθμιστικές αρχές, καθώς όλοι από τη σκοπιά τους επιχειρούν να κινηθούν σε ένα διαρκώς εξελισσόμενο τοπίο ως προς τη χρήση και τη διανομή των πληροφοριών, στην εποχή της δημιουργικής τεχνητής νοημοσύνης.

Διαβάστε ολόκληρο το άρθρο

Dimitris_1981 · 3 Ιουλίου

Σαν τον Σουρμπούτη στο πέτα την φριτέζα....

grayden · 3 Ιουλίου

Θάνατος στο copyright

Bourdoulas · 3 Ιουλίου

13 λεπτά πριν, grayden είπε

Θάνατος στο copyright

Μέχρι να καπηλευτεί κάποιος τον κόπο σου. Τότε θα βγαίνεις και θα κλαίγεσαι.

grayden · 3 Ιουλίου

2 λεπτά πριν, Bourdoulas είπε

Μέχρι να καπηλευτεί κάποιος τον κόπο σου. Τότε θα βγαίνεις και θα κλαίγεσαι.

Παράγω καθημερινά copyright.

Οτιδήποτε πάνω από 10 χρόνια (άντε 20 για βαριές επενδύσεις) είναι καρκίνος για την κοινωνία.

gadgetseek · 3 Ιουλίου

"Προκειμένου να προστατευτεί έναντι τυχόν προσφυγών και, ενδεχομένως, να κατευνάσει τους εκδότες, η Perplexity εξετάζει συμφωνίες διαμοιρασμού των διαφημιστικών εσόδων"

Και κάπου εδώ βρίσκεται η λύση του προβλήματος: να λαμβάνουν και οι δημιουργοί - εκδότες το συμφωνημένο κάτι τις τους. Και φυσικά να αναφέρονται λεπτομερώς οι πηγές από τις οποίες προέρχεται μία απάντηση σε ερώτημα συνδρομητή της Perplexity.

Δυστυχώς ό,τι και να κάνουν οι πνευματικοί δημιουργοί η ΑΙ θα βρίσκεται πάντα αρκετά βήματα μπροστά. Και μάλιστα ολοένα και πιο έτοιμη να τους κλέψει τη δουλειά..

2 ώρες πριν, grayden είπε

Θάνατος στο copyright.. / Οτιδήποτε πάνω από 10 χρόνια (άντε 20 για βαριές επενδύσεις) είναι καρκίνος για την κοινωνία.

Θάνατος όχι, σίγουρα όμως ρύθμιση για μικρότερη διάρκεια τόσο στην πνευματική δημιουργία όσο και στις επιστημονικές πατέντες.. / Και να που τελικά συμφωνούμε..

Επεξ/σία 3 Ιουλίου από gadgetseek

grayden · 3 Ιουλίου

Μόλις τώρα, gadgetseek είπε

Θάνατος όχι, σίγουρα όμως ρύθμιση για μικρότερη διάρκεια τόσο στην πνευματική δημιουργία όσο και στις επιστημονικές πατέντες..

Ναι, πέραν του slogan, η θέση μου είναι "Οτιδήποτε πάνω από 10 χρόνια (άντε 20 για βαριές επενδύσεις) είναι καρκίνος για την κοινωνία."

Bourdoulas · 3 Ιουλίου

1 ώρα πριν, grayden είπε

Παράγω καθημερινά copyright.

Οτιδήποτε πάνω από 10 χρόνια (άντε 20 για βαριές επενδύσεις) είναι καρκίνος για την κοινωνία.

Άρα δεν θες θάνατο στο copyright αλλά ρύθμιση. Ναι δεν διαφωνώ.

dchatz · 3 Ιουλίου

Να κάνω μια ερώτηση;

Είμαι μηχανικός, ένας πελάτης με ρωτάει μία τεχνική ερώτηση, εγώ το googlαρω και βρίσκω την απάντηση σε μία δωρεάν ιστοσελίδα που περιγράφει το ίδιο πρόβλημα.

Τη λέω στον πελάτη και τη χρεώνω την απάντηση ως μηχανικός 50 ευρώ.

(για να προλάβω κάποιους, δεν ισχύει ότι θα μπορούσε και ο πελάτης να googlαρει για να βει την απάντηση γιατί εγω ως μηχανικός μπορούσα να καταλάβω το άρθρο που διαβασα και να αξιολογήσω τις πληροφορίες που λέει ενώ ο πελάτης που είναι π.χ. φούρναρης δε θα μπορούσε)

Είμαι παράνομος;

grayden · 3 Ιουλίου

32 λεπτά πριν, Bourdoulas είπε

Άρα δεν θες θάνατο στο copyright αλλά ρύθμιση. Ναι δεν διαφωνώ.

Τα 10-20 χρόνια σε σχέση με τα 100-150 που ισχύει τώρα είναι θάνατος.

anax111 · 3 Ιουλίου

16 λεπτά πριν, dchatz είπε

Να κάνω μια ερώτηση;

Είμαι μηχανικός, ένας πελάτης με ρωτάει μία τεχνική ερώτηση, εγώ το googlαρω και βρίσκω την απάντηση σε μία δωρεάν ιστοσελίδα που περιγράφει το ίδιο πρόβλημα.

Τη λέω στον πελάτη και τη χρεώνω την απάντηση ως μηχανικός 50 ευρώ.

(για να προλάβω κάποιους, δεν ισχύει ότι θα μπορούσε και ο πελάτης να googlαρει για να βει την απάντηση γιατί εγω ως μηχανικός μπορούσα να καταλάβω το άρθρο που διαβασα και να αξιολογήσω τις πληροφορίες που λέει ενώ ο πελάτης που είναι π.χ. φούρναρης δε θα μπορούσε)

Είμαι παράνομος;

Στην περίπτωση αυτή όχι. Γιατί άσχετα από το αν αναζήτησες και χρησιμοποίησες ελεύθερη πληροφορία και πάλι προκειμένου να λυθεί το πρόβλημα του πελάτη σου χρησιμοποίησες δική σου τεχνογνωσία για την αναζήτηση. Ούτως ή άλλως εδώ και 100 χρόνια όλοι οι μηχανικοί συμβουλεύονται τα service manual που κυκλοφορούν ελεύθερα στην αγορά. Ωστόσο το πρόβλημα δεν είναι η δική σου πρακτική αλλά το γεγονός ότι τα προγράμματα τεχνητής νοημοσύνης έχουν κέρδη από αυτό σε μαζική κλίμακα. Είναι τελείως διαφορετικό πράγμα να ψάχνει ένα μηχανικός μια λύση σε ένα πρόβλημα από ελεύθερα sites και τελείως διαφορετικό να εκπαιδεύσεις με όλη αυτή την πληροφορία μια τεχνητή νοημοσύνη εμπορικά εκμεταλλεύσιμη με οποιοδήποτε τρόπο (π.χ. διαφημίσεις) που μόλις εκπαιδευτεί θα μπορεί να λύσει χιλιάδες προβλήματα σε ελάχιστο χρόνο στερώντας την αμοιβή της υπηρεσίας αυτής από χιλιάδες ανθρώπους.

grayden · 3 Ιουλίου

13 λεπτά πριν, anax111 είπε

στερώντας την αμοιβή της υπηρεσίας αυτής από χιλιάδες ανθρώπους.

Πόσα άλογα έχεις;

Dimitris_1981 · 3 Ιουλίου

H κατάσταση είναι ήδη εκτός ελέγχου. Τα data υπάρχουν εκεί έξω ελεύθερα και όσο και να μπουν κανόνες σιγά μην τηρηθούν. Επίσης αν δεν τηρηθούν, συνήθως τα πρόστιμα είναι υποπολλαπλάσια των κερδών. Μια εγγραφή στις προβλέψεις εξόδων δηλαδή....

Μια λύση περιορισμού είναι ίσως εξοντωτικά πρόστιμα (αρκετά πάνω από τα κέρδη) και τα Site που θέλουν να προστατευτούν να βάλουν Limits στα requests σε αριθμό και όγκο.

Η λύση του να μην είναι διαθέσιμο το περιεχόμενο σε μη logged in χρήστες νομίζω δεν είναι εφικτή.

cpc464 · 3 Ιουλίου

1 ώρα πριν, dchatz είπε

Είμαι παράνομος;

Εάν εσύ είσαι παράνομος τότε όλοι αυτοί οι προγραμματιστές που παίρνουν έτοιμο κώδικα από άλλους στο github τι είναι?.

grayden · 3 Ιουλίου

1 ώρα πριν, Dimitris_1981 είπε

H κατάσταση είναι ήδη εκτός ελέγχου. Τα data υπάρχουν εκεί έξω ελεύθερα και όσο και να μπουν κανόνες σιγά μην τηρηθούν. Επίσης αν δεν τηρηθούν, συνήθως τα πρόστιμα είναι υποπολλαπλάσια των κερδών. Μια εγγραφή στις προβλέψεις εξόδων δηλαδή....

Μια λύση περιορισμού είναι ίσως εξοντωτικά πρόστιμα (αρκετά πάνω από τα κέρδη) και τα Site που θέλουν να προστατευτούν να βάλουν Limits στα requests σε αριθμό και όγκο.

Η λύση του να μην είναι διαθέσιμο το περιεχόμενο σε μη logged in χρήστες νομίζω δεν είναι εφικτή.

Δεν υπάρχουν κέρδη. Πρακτικά απολύτως κανένας δεν έχει βγάλει τα λεφτά του από τις επενδύσεις αυτές, μόνο κάποιες τρίτες εταιρείες που πατάνε πάνω στα μοντέλα έχουν βγάλει κάτι ψιλά.

44 λεπτά πριν, cpc464 είπε

Εάν εσύ είσαι παράνομος τότε όλοι αυτοί οι προγραμματιστές που παίρνουν έτοιμο κώδικα από άλλους στο github τι είναι?.

Σύνδεση

Ειδησεογραφικοί οργανισμοί κατηγορούν την Perplexity για λογοκλοπή και αθέμιτη συλλογή πληροφοριών από το διαδίκτυο

Προτεινόμενες αναρτήσεις

nchatz

Dimitris_1981

grayden

Bourdoulas

grayden

gadgetseek

grayden

Bourdoulas

dchatz

grayden

anax111

grayden

Dimitris_1981

cpc464

grayden

Δημιουργήστε ένα λογαριασμό ή συνδεθείτε για να σχολιάσετε

Δημιουργία λογαριασμού

Σύνδεση

Σύνδεση