Άλλοι έχουν εκφράσει ανησυχίες σχετικά με την ασφάλεια στον κυβερνοχώρο και το απόρρητο των δεδομένων. Η τελευταία έκθεση αποκαλύπτει ότι το DeepSeek είναι ευάλωτο σε επιθέσεις που χρησιμοποιούν επιβλαβείς προτροπές. Ωστόσο, είναι ενδιαφέρον ότι δεν είναι το μόνο chatbot AI επιρρεπές σε αυτό.
Το DeepSeek AI είναι εξαιρετικά ευάλωτο σε επιβλαβείς επιθέσεις που βασίζονται σε προτροπές, ισχυρίζεται η Cisco
Σύμφωνα με έκθεση της Cisco, το ποσοστό επιτυχίας επίθεσης (ASR) του μοντέλου DeepSeek R1 AI σχετικά με τη χρήση επιβλαβών προτροπών είναι περίπου 100%. Οι δοκιμές της Cisco αφορούσαν περισσότερα από 50 τυχαία μηνύματα που είχαν σχεδιαστεί για να οδηγήσουν σε επιβλαβή συμπεριφορά. Οι προτροπές, που εξάγονται από το σύνολο δεδομένων HarmBench, καλύπτουν έως και έξι κατηγορίες επιβλαβών συμπεριφορών, μεταξύ των οποίων είναι το «έγκλημα στον κυβερνοχώρο, η παραπληροφόρηση, οι παράνομες δραστηριότητες και η γενική βλάβη».
Η Cisco τονίζει ότι το DeepSeek R1 δεν μπόρεσε να αποκλείσει κανένα από τα επιβλαβή μηνύματα. Έτσι, η ομάδα καταλήγει στο συμπέρασμα ότι η κινεζική πλατφόρμα AI είναι «πολύ επιρρεπής σε αλγοριθμικό jailbreaking και πιθανή κακή χρήση». Η χρήση προτροπών που έχουν σχεδιαστεί για την παράκαμψη ηθικών περιορισμών και περιορισμών ασφαλείας στις πλατφόρμες τεχνητής νοημοσύνης ονομάζεται "jailbreaking". Η PromptFoo, μια startup τεχνητής νοημοσύνης στον κυβερνοχώρο, δήλωσε επίσης την περασμένη εβδομάδα ότι τα μοντέλα DeepSeek είναι ευάλωτα σε jailbreak.
Άλλα chatbot AI παρουσιάζουν επίσης υψηλή ευπάθεια στο jailbreaking
Βέβαια, μπορεί να εκπλαγείτε όταν μάθετε ότι άλλα, πιο γνωστά και αξιόπιστα μοντέλα τεχνητής νοημοσύνης έχουν επίσης ένα ανησυχητικά υψηλό επίπεδο ASR. Το μοντέλο GPT 1.5 Pro είχε ASR 86%, ενώ το Llama 3.1 405B είναι ακόμα πιο επιεικής με ASR περίπου 96%. Το μοντέλο AI με τις κορυφαίες επιδόσεις από αυτή την άποψη ήταν το o1 preview με ASR μόλις 26%.
«Η έρευνά μας υπογραμμίζει την επείγουσα ανάγκη για αυστηρή αξιολόγηση ασφάλειας στην ανάπτυξη της τεχνητής νοημοσύνης για να διασφαλιστεί ότι οι ανακαλύψεις στην αποτελεσματικότητα και τη λογική δεν έρχονται σε βάρος της ασφάλειας», αναφέρει η έκθεση της Cisco.
Αυτή δεν είναι η μόνη κόκκινη σημαία που έχει εμφανιστεί γύρω από το chatbot του DeepSeek. Ειδικοί και αξιωματούχοι έχουν προειδοποιήσει για τις πολιτικές διαχείρισης δεδομένων της εταιρείας. Επί του παρόντος, όλα τα δεδομένα χρήστη που έχει συλλέξει πηγαίνουν σε διακομιστές στην Κίνα, όπου οι νόμοι επιτρέπουν στην τοπική κυβέρνηση να ζητά πρόσβαση όποτε θέλει. Το PromptFoo σημείωσε επίσης το υψηλό επίπεδο λογοκρισίας για μηνύματα που σχετίζονται με ευαίσθητα θέματα για την Κίνα. Επιπλέον, πρόσφατα εμφανίστηκε η πρώτη διαρροή δεδομένων από το DeepSeek.
follow us
Για να μην χάνεις τα νέα μας ακολούθησε μας στο Google News, αλλά και σε Facebook, Instagram, Youtube