Was ist der beste Weg, Porno-Bilder programmatisch zu erkennen?
Akismet macht einen fantastischen job bei der Erkennung von spam-Kommentaren. Aber Kommentare sind nicht die einzige form von spam in diesen Tagen. Was ist, wenn ich wollte, so etwas wie akismet automatisch zu erkennen porno Bilder auf eine social-networking-Website, die erlaubt Benutzern das hochladen Ihrer Bilder, Avatare, etc?
Gibt es bereits ein paar image-basierte Suchmaschinen sowie Gesichtserkennung Sachen, so bin ich der Annahme, es wäre nicht Rakete Wissenschaft, und es getan werden könnte. Allerdings habe ich keine Ahnung über wie das Zeug funktioniert und wie sollte ich Vorgehen, wenn ich will, um es zu entwickeln, von Grund auf.
Wie soll ich anfangen?
Gibt es eine open-source-Projekt für das gehen auf?
InformationsquelleAutor der Frage Raj | 2009-04-03
Du musst angemeldet sein, um einen Kommentar abzugeben.
Dies geschrieben wurde, im Jahr 2000, nicht sicher, ob der Stand der Technik in der porno-Erkennung erweitert wurde, aber ich bezweifle es.
http://www.dansdata.com/pornsweeper.htm
InformationsquelleAutor der Antwort Jeff Atwood
Dies ist eigentlich Recht einfach. Sie können programmgesteuert erkennen von Hauttönen - und-porno-Bilder neigen dazu, eine Menge Haut. Dadurch wird der false-positives, aber wenn dies ein problem ist, können Sie pass-Bilder so erkannt durch den tatsächlichen Maßen. Dies nicht nur reduziert die Arbeit für die Moderatoren, sondern bietet Ihnen auch jede Menge von gratis Pornos. Es ist win-win.
Dieser code-Massnahmen Haut-Töne in der Mitte des Bildes. Getestet hab ich auf 20 relativ zahm "porno" - Bilder und 20 völlig unschuldigen Bilder. Es kennzeichnet 100% der "porno" und 4 von den 20 der saubere Bilder. Das ist ein ziemlich hoher false-positive-rate, aber das Skript soll ziemlich vorsichtig und konnte weiter optimiert werden. Es funktioniert auf hellen, dunklen und asiatischen Hauttöne.
Es Schwächen mit false positives sind Braun Objekte wie sand und Holz, und natürlich es nicht kennen den Unterschied zwischen "frech" und "nett" Fleisch (z.B. face-Aufnahmen).
Schwäche mit false negatives wären Bilder ohne viel ungeschütztes Fleisch (wie Leder bondage), Bemalte oder Tätowierte Haut, B&W-Bilder, etc.
Quellcode und Beispiel-Bilder
InformationsquelleAutor der Antwort SpliFF
Ich würde eher erlauben, Anwender berichten über schlechte Bilder. Bilderkennung Entwicklung kann zu viel Bemühungen und Zeit und nicht so viel wie genau wie menschliche Augen. Es ist viel günstiger zu outsourcen, MODERATIONS-job.
Werfen Sie einen Blick auf: Amazon Mechanical Turk
"Amazon Mechanical Turk (MTurk) ist eine suite von Amazon Web Services, ein crowdsourcing-Marktplatz, der es ermöglicht, computer-Programme so zu koordinieren, die Verwendung menschlicher Intelligenz, um Aufgaben, die Computer nicht in der Lage sind zu tun."
InformationsquelleAutor der Antwort Konstantin Tarkus
InformationsquelleAutor der Antwort Brian Lyttle
BOOM! Hier ist die whitepaper mit dem Algorithmus.
Weiß jemand, wo man den Quellcode für eine java (oder jede andere Sprache) - Implementierung?
Wäre rock.
Einem Algorithmus namens WEISER hat eine 98% Genauigkeit rate aber von 14% falsch-positiv-rate. Also, was Sie tun ist, Sie lassen Sie die Benutzer-flag die 2% falsch-negative Befunde, idealerweise mit automatische Entfernung, wenn eine bestimmte Anzahl von Benutzern, Flagge, und haben die Moderatoren-Ansicht die 14% false positives.
InformationsquelleAutor der Antwort davidjnelson
Nude.js auf der Grundlage der whitepaper von Rigan Ap-apid von De La Salle Universität.
InformationsquelleAutor der Antwort Abhinav Kaushik
Gibt es software, die erkennt die Wahrscheinlichkeit für Pornos, aber dies ist nicht eine genaue Wissenschaft, wie Computer kann nicht erkennen, was eigentlich auf den Bildern (die Bilder sind nur eine große Menge von Werten auf einem Gitter ohne Bedeutung). Sie kann nur lehren, dem computer, was porno ist und was nicht, indem Sie Beispiele. Dies hat den Nachteil, dass Sie nur erkennen, diese oder ähnliche Bilder.
Angesichts der sich wiederholenden Natur der porno, Sie haben eine gute chance, wenn Sie trainieren, das system mit wenigen false-positives. Zum Beispiel, wenn Sie trainieren, das system mit der nackten Menschen kann es Flagge Bilder von einem Strand mit "fast" Nackte Menschen als porno zu.
Einer ähnlichen software ist die facebook-software, die vor kurzem kam heraus. Es ist nur spezialisiert auf die Gesichter. Das Prinzip ist das gleiche.
Technisch würden Sie implementieren eine Art von feature-Detektor, der verwendet einen bayes-Filter. Die feature-Detektor Aussehen kann für Funktionen wie Prozentsatz der Fleisch-farbigen Pixeln, wenn es ein einfacher Detektor oder einfach nur berechnet die ähnlichkeit des aktuellen Bildes mit einem gespeicherten porno-Bilder.
Dies beschränkt sich natürlich nicht um Pornos, es ist eigentlich mehr eine Ecke Fall. Ich denke häufiger sind Systeme, die versuchen, andere Sachen zu finden in Bilder 😉
InformationsquelleAutor der Antwort Patrick Cornelissen
Die Antwort ist wirklich einfach: Es ist ziemlich sicher zu sagen, dass es nicht möglich ist, in den nächsten zwei Jahrzehnten. Vorher werden wir wohl eine gute übersetzung tools. Das Letzte mal habe ich geprüft, die KI-Jungs zu kämpfen hatten, zu identifizieren, die das gleiche Auto auf zwei Fotos geschossen, die aus einem leicht veränderten Winkel. Werfen Sie einen Blick auf, wie lange es dauerte, bis Sie gut genug, OCR oder Spracherkennung zusammen. Diese sind eine Anerkennung der Probleme, die den nutzen stark von Wörterbüchern und sind noch weit entfernt von vollständig zuverlässige Lösungen, die trotz multi-Millionen-Mann Monate auf Sie geworfen.
Dass gesagt wird, können Sie einfach fügen Sie eine "offensive?" - link neben " user generated contend und haben ein mod cross-check der eingehenden Beschwerden.
edit:
Ich vergaß etwas: WENN Sie gehen, um zu implementieren eine Art von filter, Sie benötigen einen zuverlässigen. Wenn Ihre Lösung wäre 50% Recht, 2000 von 4000 Nutzern mit anständigen Bilder blockiert werden. Erwarten eine Unverschämtheit.
InformationsquelleAutor der Antwort Thomasz
Student von der National Cheng Kung University in Taiwan habe eine Forschung zu diesem Thema in 2004. Er war in der Lage zu erreichen, Erfolg-rate von 89.79% bei der Erkennung von Nacktbilder aus dem Internet heruntergeladen. Hier ist der link zu seiner Arbeit: Die Studie über die Nackte Bild-Erkennung auf Basis der Hautfarbe
Es ist in der chinesischen daher müssen Sie möglicherweise einen übersetzer, falls Sie es nicht Lesen kann.
InformationsquelleAutor der Antwort myang
kurze Antwort: verwenden Sie einen moderator 😉
Lange Antwort: ich glaube nicht, dass es ein Projekt für diese Ursache, was ist porno? Nur die Beine, die volle Nacktheit, Zwerge etc. Seine subjektiv.
InformationsquelleAutor der Antwort RvdK
Fügen Sie ein offensiv-link und speichern Sie die md5 (oder andere hash) des betreffenden Bildes, so dass es automatisch markiert in der Zukunft.
Wie cool wäre es, wenn jemand hatte eine große öffentliche Datenbank mit md5-Bild zusammen mit beschreibenden tags läuft als webservice? Viel porno ist nicht original, (dass die person, die es nun nicht wahrscheinlich ist) und die populären Bilder neigen dazu, zu schweben verschiedenen Orten, so dass dies wirklich einen Unterschied machen könnte.
InformationsquelleAutor der Antwort rfusca
Wenn Sie wirklich Zeit und Geld:
Einen Weg, es zu tun ist durch 1) Schreiben Sie eine Bild-Erkennung-Algorithmus, um herauszufinden, ob ein Objekt ein Mensch ist oder nicht. Diese kann getan werden, indem bitmasking ein Bild, um es abzurufen "Konturen" und sehen, ob passt die Konturen einer menschlichen Kontur.
2) Daten, die mir eine Menge porno Bilder und verwenden, data mining-Techniken wie die C4-algorithmen oder Particle Swarm Optimization, zu lernen, zu erkennen, die Muster, die Suche-porno-Bilder.
Wird dies erfordern, dass Sie erkennen, wie ein nackter Mann/Frau, die Konturen eines menschlichen Körpers Aussehen muss in digitaler Form (dies kann erreicht werden, in der gleichen Weise OCR-bilderkennungs-algorithmen funktioniert).
Hoffe, Sie haben Spaß! 🙂
InformationsquelleAutor der Antwort Buhake Sindi
Scheint mir wie das größte Hindernis ist die Definition eines "porno Bild". Wenn Sie definieren können, ist es leicht, könnten Sie wahrscheinlich etwas schreiben, das würde funktionieren. Aber auch der Mensch kann nicht darüber einig, was ist porno. Wie wird die Anwendung wissen? User-moderation ist vermutlich Ihre beste Wette.
InformationsquelleAutor der Antwort Rimian
Ich habe gesehen, ein web-Filterung Anwendung, die nicht-porno-Bild-Filterung, sorry, ich kann mich nicht erinnern, den Namen. Es war ziemlich anfällig für Fehlalarme, aber die meisten der Zeit es funktioniert.
Ich denke, dass wichtigste trick ist, zu erkennen, "zu viel Haut auf dem Bild 🙂
InformationsquelleAutor der Antwort dr. evil
Erkennen porno Bilder noch eine bestimmte AI-Aufgabe, die sehr viel theoretischen noch.
Ernte kollektive macht und menschliche Intelligenz, indem ein button/link "Report spam/abuse". Oder beschäftigen einige Moderatoren um diesen job zu machen.
P. S. Wirklich überrascht, wie viele Leute Fragen stellen, vorausgesetzt software und algorithmen sind all-mächtig, ohne auch nur daran zu denken, ob das, was Sie wollen getan werden könnte. Sind Sie Vertreter jener neuen Generation von Programmierern, die haben kein Verständnis, hardware, low-level-Programmierung und alle, die "Magie hinter"?
P. S. #2. Ich erinnere mich auch, dass in regelmäßigen Abständen passiert es, dass einige die situation, wenn Menschen sich nicht entscheiden kann, ob ein Bild porno oder Kunst ergriffen werden, um das Gericht. Auch nach der Entscheidung des Gerichts, die Chancen sind die Hälfte der Leute betrachten die Entscheidung falsch. Der Letzte dumme situation der Art war vor kurzem bei einer Wikipedia-Seite bekam in England verboten, weil Sie ein CD-cover-Bild mit einigen Nacktheit.
InformationsquelleAutor der Antwort User
Zwei Optionen, die ich denken kann (obwohl keiner von Ihnen wird programmatisch erkennen porno):
InformationsquelleAutor der Antwort Rich
Den BrightCloud web-service-API ist perfekt für diese. Es ist eine REST-API für tun lookups website wie diese. Es enthält eine sehr große und sehr präzise web-Filterung DB und einer der Kategorien, für Erwachsene, verfügt über 10M porno-Seiten identifiziert!
InformationsquelleAutor der Antwort Chris Harris
Ich habe gehört, über die tools, die mit sehr einfachen, aber sehr effektiven Algorithmus. Der Algorithmus berechnet die relative Menge der Pixel mit einem Farbwert in der Nähe einige vordefinierte "Haut" - Farben. Wenn dieser Betrag höher als einige vordefinierte Wert dann image als erotische/Pornographische Inhalte. Natürlich, der Algorithmus geben wird, falsch positive Ergebnisse für close-up-Gesicht-Fotos und viele andere Dinge.
Da Sie schreiben, über soziale Netzwerke gibt es viele "normale" Fotos mit hoher Betrag von der Hautfarbe auf, so sollten Sie nicht verwenden Sie diesen Algorithmus zu leugnen, alle Bilder mit positivem Ergebnis. Aber Sie können es verwenden, bieten einige Hilfe für Moderatoren, zum Beispiel Kennzeichnen Sie diese Bilder mit einer höheren Priorität, so dass, wenn moderator möchten Sie überprüfen, einige neue Bilder für pornografische Inhalte kann er beginnen, von diesen Bildern.
InformationsquelleAutor der Antwort okutane
Dieser sieht vielversprechend aus. Im Grunde genommen erkennen Sie die Haut (mit Kalibrierung durch erkennen von Gesichtern) und bestimmen "Haut " Pfade" (d.h. die Messung der Anteil der Haut-Pixel vs. Gesichtshaut Pixel /Haut-Pixel). Dieser hat ordentliche Leistung.
http://www.prip.tuwien.ac.at/people/julian/skin-detection
InformationsquelleAutor der Antwort alexsee75
Blick auf Dateinamen und-Attribute. Es gibt nicht annähernd genug Informationen um zu erkennen, sogar 20% von naughty Bilder, aber eine einfache keyword-blacklist würde zumindest erkennen Bilder mit beschreibenden Bezeichnungen oder Metadaten. 20 Minuten von der Codierung für eine 20% Erfolgsrate ist nicht eine schlechte Sache, vor allem, als bei der Vorauswahl, die zumindest fangen einige einfache diejenigen, die, bevor Sie übergeben den rest an einen moderator zu urteilen.
Den anderen nützlichen trick ist das Gegenteil von natürlich, pflegen einer whitelist von Bild-Quellen zu ermöglichen, ohne moderation oder Kontrolle. Wenn die meisten Ihrer Bilder stammen aus bekannten safe-Uploader oder Quellen, können Sie einfach akzeptieren, Sie bindly.
InformationsquelleAutor der Antwort SPWorley
— United States Supreme Court Justice Potter Stewart, 1964
InformationsquelleAutor der Antwort Jason S
Finden Sie viele whitepapers im Netz mit diesem Thema beschäftigen.
InformationsquelleAutor der Antwort Dejan
Es ist nicht Rakete Wissenschaft. Nicht mehr. Es ist sehr ähnlich zu der Gesichtserkennung. Ich denke, dass der einfachste Weg, damit umzugehen, ist die Verwendung von machine learning. Und da sind wir Umgang mit Bildern, ich kann in Richtung neuronale Netze, da diese zu sein scheinen bevorzugt für Bilder. Sie benötigen Trainingsdaten. Und Sie können finden Tonnen von Trainings-Daten über das internet, aber Sie haben zum beschneiden der Bilder, um den spezifischen Teil, den Sie möchten, dass der Algorithmus zu erkennen. Natürlich haben Sie zu brechen, das problem in verschiedene Körperteile, die Sie wollen, zu erkennen und zu erstellen, Trainings-Daten für jede, und das ist, wo die Dinge ganz amüsant werden.
Wie jemand oben schon sagte, es kann nicht getan werden, zu 100% Prozent. Es wird Fälle geben, wo solche algorithmen Versagen. Die tatsächliche Genauigkeit wird ermittelt, indem die Trainingsdaten, die Struktur von neuronalen Netzen und wie Sie wählen werden, um cluster der Trainingsdaten (Penisse, vaginas, Brüste, etc, und Kombinationen von solchen). In jedem Fall bin ich sehr zuversichtlich, dass dies erreicht werden kann, mit hoher Genauigkeit für explizite porno-Bilder.
InformationsquelleAutor der Antwort Radu Simionescu
Dies ist eine Nacktheit Detektor. Ich habe es nicht ausprobiert. Es ist die einzige OSS das ich finden konnte.
https://code.google.com/p/nudetech
InformationsquelleAutor der Antwort mikeslattery
Dort ist keine Weise, die Sie tun können, diese zu 100% (ich würde sagen, vielleicht 1-5% plausibel wäre) mit heutzutage wissen. Sie bekommen viel bessere Ergebnisse (als die 1-5%) nur die überprüfung der image-Namen für sex-bezogene-Worte :).
@SO Troll: So wahr.
InformationsquelleAutor der Antwort sabiland