Zeigt zu viel "Haut" - Erkennung in der software

Baue ich eine ASP.NET Website, wo die Benutzer können Fotos hochladen, von sich selbst. Es könnte Tausende von Fotos hochgeladen jeden Tag. Eine Sache, die mein boss hat gefragt, ein paar mal ist, wenn es irgendeinen Weg gibt, könnten wir erkennen, wenn eines der Fotos zeigen zu viel "Haut", und automatisch verschieben, Kennzeichnen Sie diese als "Nur für Erwachsene", bevor die Redaktion die endgültige Entscheidung.

Kann ich nicht wirklich beantworten, aber ich möchte nur darauf hinweisen, dass diese automatische Melder sind wirklich gut zur Identifikation von kahlen Menschen als nackt.
lol, es hat eine Verwendung für Sie, dass irgendwo!

InformationsquelleAutor Craig | 2008-11-04

asp.net image-processing

Ihre beste Wette ist, um deal mit der Bild in den HSV-Farbraum (siehe hier für die rgb - hsv-Umrechnung). Die Farbe der Haut ist ziemlich das gleiche, zwischen allen Rassen, die nur die Sättigung verändert es sich. Durch den Umgang mit dem Bild im HSV-Sie können einfach eine Suche für die Farbe der Haut.

Dies können Sie tun, indem Sie einfach zählen die Anzahl der pixel innerhalb einer Farbpalette, oder Sie könnten führen region wachsen um pixel zu berechnen, die Größe der Bereiche, in denen die Farbe.

Edit: für den Umgang mit körnige Bilder, die Sie möchten möglicherweise führen Sie eine median-filter auf zuerst das Bild und dann reduzieren Sie die Anzahl der Farben zu segmentieren das Bild zuerst, Sie zu spielen, um mit den Einstellungen, die auf einer großen Menge von pre-klassierten (erwachsen oder nicht) Bilder und sehen Sie, wie die Werte sich Verhalten, um ein zufriedenstellendes Niveau der Erkennung.

EDIT: Hier etwas code, das sollte eine einfache Zählung (nicht getestet, es ist eine schnelle mashup von code aus hier und rgb auf hsl hier)

Bitmap b = new Bitmap(_image);
BitmapData bData = b.LockBits(new Rectangle(0, 0, _image.Width, _image.Height), ImageLockMode.ReadWrite, b.PixelFormat);
byte bitsPerPixel = GetBitsPerPixel(bData.PixelFormat);
byte* scan0 = (byte*)bData.Scan0.ToPointer();

int count;

for (int i = 0; i < bData.Height; ++i)
{
    for (int j = 0; j < bData.Width; ++j)
    {
        byte* data = scan0 + i * bData.Stride + j * bitsPerPixel / 8;

        byte r = data[2];
        byte g = data[1];
        byte b = data[0];

        byte max = (byte)Math.Max(r, Math.Max(g, b));
        byte min = (byte)Math.Min(r, Math.Min(g, b));

        int h;

        if(max == min)
            h = 0;
        else if(r > g && r > b)
            h = (60 * ((g - b) / (max - min))) % 360;
        else if (g > r && g > b)
            h = 60 * ((b - r)/max - min) + 120;
        else if (b > r && b > g)
            h = 60 * ((r - g) / max - min) + 240;


        if(h > _lowerThresh && h < _upperThresh)
            count++;
    }
}
b.UnlockBits(bData);

+1, weil Sie klingen wie Sie wissen, was Sie tun.
Sehr wichtig, wäre natürlich sicherstellen, dass die Editoren sind schnell zu überprüfen, verdächtige Bilder, weil Sie wahrscheinlich sind zu viele false positives.

InformationsquelleAutor Andrew Bullock

34

Natürlich, diese Fehler für den ersten Benutzer, der Beiträge, die ein close-up eines Gesichts (oder der hand oder Fuß, oder ähnliches). Letztlich sind alle diese Formen der automatisierten Zensur schlägt fehl, bis es einen echten Paradigmen-Wechsel in der Art und Weise Computern zu tun Objekterkennung.

Ich sage nicht, dass Sie sollten nicht versuchen, es trotzdem; aber ich möchte auf diese Probleme. Erwarten Sie nicht perfekt (oder sogar gute) Lösung. Es existiert nicht.
- Wahrscheinlich ein guter Kompromiss ist die Umsetzung einer hoch-Empfindlichkeit Menschen-Detektor, so dass nur absolut-nicht-porno akzeptiert der computer, und alles andere (hoffentlich viel kleineren Bruchteil der Gesamtzahl), sollte überprüft werden, indem ein menschlicher Klassifizierer.
- Und dann bekommen Sie PR-Katastrophen wie Facebook, die vor kurzem gesperrt, Bilder von Menschen, die sah nackt, obwohl Sie gar nicht (wohlgemerkt, Facebook nutzt human Moderatoren eher als eine software-Lösung). Und neben der schlechten PR, diese einfach Beigeschmack der Zensur. Jedem das seine, aber wenn ich waren erforderlich, um zu implementieren eine ähnliche Lösung, die bevorzugt falsch-positive Ergebnisse eher als falsche negative, dies könnte ein Grund für die resignation.
InformationsquelleAutor Konrad Rudolph
21

Bezweifle ich, dass es keine off-the-shelf-software, die bestimmen können, wenn die user-uploads ein freches Bild. Ihre beste Wette ist, um Benutzern die Bilder Kennzeichnen, die als 'Nur für Erwachsene' mit einer Taste neben dem Bild. (Klarstellung: ich meine damit ein anderer Benutzer als derjenige, der Sie hochgeladen das Bild-ähnlich wie die Beiträge können markiert werden beleidigend hier auf StackOverflow.)

Überlegen Sie auch, diese überprüfung von einem Versuch zu tun, die gleiche Sache in einem eigenen Produkt: http://www.dansdata.com/pornsweeper.htm.

Link geklaut aus heutiger StackOverflow-podcast, natürlich :).
- Tun Sie wirklich Vertrauen Nutzer einer site zu überprüfen, die "evil bit", wenn Sie ein Bild laden, das ist fraglich?
- Ich denke er meint, dass andere Benutzer die Flagge als offensive / adult only. (Und eine Kopie an mich =D)
- oder implementieren Sie eine Liste der Benutzer, um es zu senden alle =)
- Es ist ein off-the-shelf freie software für, die, hier github.com/EugenCepoi/nsfw_api 🙂
- Diese Antwort ist fast 10 Jahre alt, und ich vermute, dass die explosion von ML in der Zwischenzeit bedeutet, dass dies jetzt ein sehr sinnvoller Vorschlag!
InformationsquelleAutor JSBձոգչ
15

Können wir auch nicht schreiben Filter, die erkennen, schmutzige Worte genau in blog-posts, und Ihr Chef wird Fragen, für eine porno-Detektor? CLBUTTIC!
- Ich weiß, es ist nicht einfach, aber ich bin sicher, dass große dating-sites wie match.com verwenden Sie irgendeine Art von Nachweis. Und es wird die zweite Stufe menschliche Redakteure zu überprüfen, für false-positives.
- Es ist alles gut, bis Sie versuchen, automatisch die Aufmerksamkeit der Kleidung auf den Bildern; was die Schrauben die meisten Menschen.
- Ich denke, Sie sind buttuming, dass der gleiche Algorithmus verwendet wird, für Bilder und Worte. Menschen, wie Sie sein sollte buttbuttinated (was seltsam klingt schlimmer als das ursprüngliche Wort, erinnert mich an den Tod durch bongo-bongo-Witz:-)).
InformationsquelleAutor Tim Howland
11

Ich würde sagen, deine Antwort liegt in crowdsourcing die Aufgabe. Dies fast immer funktioniert und neigt zu skalieren sehr gut.

Es muss nicht beinhalten, dass einige Benutzer in "admins" zu sein und kommen mit verschiedenen Berechtigungen - es kann so einfach sein wie damit eine "unangemessene" link neben jedem Bild und halten Sie dabei zählen.
- Wir gehen diesen Weg so gut denke ich.
- Oder lagern Sie es auf Mechanical Turk
- Es ist ein benutzerfreundliches cartoon auf dieser: ars.userfriendly.org/cartoons/?id=20081210
InformationsquelleAutor conny
6

Siehe die wegweisenden Papier "Finden Nackte Menschen" von Fleck/Forsyth veröffentlicht in ECCV. (Advanced).

http://www.cs.hmc.edu/~fleck/naked.html

InformationsquelleAutor graveca
5

Interessante Frage aus einem theoretischen /Algorithmische standppoint. Ein Ansatz für das problem wäre die flag-Bilder, die große hautfarbene Regionen (wie bereits von Trull).

Jedoch, die Menge an Haut die gezeigt wird, ist nicht ein Faktor für eine offesive Bild, es ist vielmehr die Lage der Haut gezeigt. Vielleicht kann man das mit der Gesichtserkennung (Suche nach algorithmen) um die Ergebnisse zu verfeinern -- festzustellen, wie groß die Haut Regionen sind relativ zu Gesicht, und wenn Sie gehören dem Gesicht (vielleicht, wie weit unten Sie sind).
- Sehr guter Vorschlag. Es ist leicht genug, um auch tatsächlich umzusetzen und würde wahrscheinlich funktionieren ziemlich gut.
InformationsquelleAutor dbkk
3

Weiß ich entweder Flickr oder Picasa hat diese umgesetzt. Ich glaube, die routine aufgerufen wurde FleshFinder.

Einen Tipp auf die Architektur, dies zu tun:

Diese laufen als windows-service getrennt von der ASP.NET Pipeline, anstatt die Analyse von Bildern in Echtzeit, erstellen Sie eine Warteschlange von neuen Bildern, die hochgeladen werden, für die service-arbeiten durch.

Können Sie verwenden Sie die normalen System.Zeichnung Zeug, wenn Sie wollen, aber wenn Sie wirklich brauchen, um zu verarbeiten, eine Menge der Bilder, es wäre besser, verwenden native-code und ein high-performance-Grafik-Bibliothek und P/invoke die routine von Ihrem service.

Als Ressourcen zur Verfügung stehen, verarbeitet die Bilder in den hintergrund und die Flagge diejenigen, die verdächtig sind, für die Redaktion abgeben, sollten diese zu beschneiden nach unten die Anzahl der Bilder zu überprüfen, erheblich, während die nicht störend Leute, die Bilder hochladen von der Haut farbigen Häuser.

InformationsquelleAutor FlySwat
3

Ich würde Ansatz das problem aus statistischer Sicht. Eine Reihe von Bildern, die Sie als sicher, und ein paar, dass Sie nicht (das wird für einen unterhaltsamen Tag der Forschung), und sehen, was Sie gemeinsam haben. Analysieren Sie alle für Farbbereich und Sättigung, um zu sehen, wenn Sie können wählen, Eigenschaften, die alle der freche Fotos, und einige von den sicher haben.
- Dies ist ein interessanter Punkt. Ich habe gehört, wie Leute von Google sagen vorher, dass genügend Daten alles kann gelöst werden mit Hilfe von Statistiken. Algorithmen sind nicht immer erforderlich. Zum Beispiel die Rechtschreibprüfung auf Google.com ist Statistik getrieben nicht einen Zauber-check-Algorithmus.
- Dies ist eine Art, was ich wollte, nur von den anderen Ansatz. Dies ist wahrscheinlich der Ausgangspunkt für das, was ich vorgeschlagen. Tun eine Last von Analyse zunächst geben Sie einige starting off Punkte für die vorgeschlagenen Schwellenwerte, die in dem Detektor.
- Eigentlich bin ich sehr interessiert, wenn Sie können senden Sie mir eine farly anständigen Satz von test-Bilder, ich hätte ein Spiel für Sie ist, können Sie gerne den code, ich könnte sourceforge es als eine Bibliothek, wenn Ihr irgendwelche guten
- Sie könnte wahrscheinlich zu durchforsten, SO gravatars für Bilder, die in der sicheren Kategorie. Das internet ist voll von test-Bild in der "naughty" - Kategorie. 🙂
InformationsquelleAutor Bill the Lizard
1

Vielleicht die Porno-Atem-Test wäre hilfreich - wie berichtet-auf Slashdot.

InformationsquelleAutor BIBD
1

Rigan Ap-apid präsentierte ein Papier auf WorldComp '08 über dieses problem Raum. Das Papier ist angeblich hier, aber der server war das timing für mich. Ich besuchte die Präsentation des Papiers, und er bedeckt vergleichbare Systeme und Ihre Wirksamkeit sowie seinen eigenen Ansatz. Sie könnten ihn direkt zu Kontaktieren.
- Versuchen Sie diesen link: math.admu.edu.ph/~raf/pcsc05/proceedings/AI4.pdf
- Ah, das könnte tatsächlich ein weiteres Papier von Rigan, aber es könnte hilfreich sein, sowieso.
InformationsquelleAutor plinth
0

Ich fürchte, ich kann nicht helfen, zeigen Sie in die richtige Richtung, aber ich erinnere mich an das Lesen über diesen Vorgang vor. Es war in dem Kontext der Menschen, die beschweren sich über baby-Bilder gefangen und markiert fälschlicherweise. Wenn nichts anderes, kann ich Ihnen die Hoffnung, dass Sie nichts erfinden das Rad ganz von selbst... Jemand anderes hat diesen Weg!
- Wenn ich mich Recht erinnere, die Lösung es zu verbieten baby-Bilder vollständig.
InformationsquelleAutor Brian Knoblauch
0

CrowdSifter von Dolores Labs könnte den trick tun für Sie. Ich lese Ihren blog die ganze Zeit, wie Sie scheinen zu lieben, Statistiken und crowdsourcing und wie, darüber zu sprechen. Verwenden Sie amazon ' s mechanical turk, die für eine Menge von Ihrer Verarbeitung und wissen, wie Sie die Ergebnisse verarbeiten, um die richtigen Antworten aus der Dinge. Sehen Sie sich Ihre blog-zumindest, um zu sehen, ein paar Coole statistische Experimente.

InformationsquelleAutor reconbot
0

Wie oben erwähnt von Bill (und Craig, die die google-quote) statistische Methoden sehr effektiv sein können.

Zwei Ansätze, die Sie könnten wollen zu schauen sind:
- Neuronale Netze
- Multi-Variate Analyse (MVA)
Den MVA-Ansatz wäre, um eine "repräsentative Stichprobe" der akzeptable Bilder und inakzeptabel Bilder. Die X-Daten wäre ein array von bytes von jedem Bild, das Y würde zugewiesen werden, die Sie als 1 für nicht hinnehmbar, und eine 0 für akzeptabel. Erstellen Sie ein PLS-Modell unter Verwendung dieser Daten. Führen Sie neue Daten mit dem Modell und sehen, wie gut es prognostiziert die Y.

Anstatt diese binäre Ansatz, den Sie haben könnte, mehrere Y ' s (z.B. 0=akzeptabel, 1=Badeanzug/Unterwäsche, 2=pornographischen)

Zur Erstellung des Modells kann man sich open-source-software oder es gibt eine Reihe von kommerziellen Softwarepaketen zur Verfügung (obwohl Sie in der Regel nicht Billig)

Weil selbst die beste statistische Ansätze sind nicht perfekt, die Idee, auch einschließlich der Benutzer-feedback wäre wahrscheinlich ein gute Idee.

Glück (und schlimmsten Fall bekommen Sie, Zeit zu verbringen, das sammeln von naughty Bilder als eine anerkannte und bezahlte Tätigkeit!)

InformationsquelleAutor PTRMark

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.