Der Edge-Browser verbessert alle Webbilder mit KI

Startseite » Der Edge-Browser verbessert alle Webbilder mit KI

Microsoft Bing hat eine neue Technologie für künstliche Intelligenz angekündigt, die Websites über Microsoft Edge ein 4K-Bilderlebnis bietet und Website-Bilder automatisch verbessert. Die Technologie namens Turing Image Super-Resolution ermöglicht die Anzeige von Bildern mit hoher Auflösung, unabhängig von der Qualität des Originalbildes.

Die neue Technologie wurde von Microsoft entwickelt Turing AI-Projektentwicklungsteam.

Wird bereits in Bing Maps verwendet

Die neue Technologie wird bereits in Bing Maps verwendet, um die Qualität ihrer Satellitenluftbilder zu verbessern.

Unten sehen Sie einen Luftbildvergleich der Google-Zentrale in Mountain View, Kalifornien.

Der Screenshot von Bing Maps befindet sich auf der linken Seite und das entsprechende Google Maps-Bild auf der rechten Seite:

Bing Maps vs. Google Maps

Wie Microsoft die Technologie entwickelt hat

Vier wichtige Ideen führten zum Erfolg des Modells.

  1. Menschliche Rezensenten
  2. Lärmmodellierung
  3. Wahrnehmungsverlust und GAN
  4. Transformers for Vision: Verbessern und Zoomen

Menschliche Rezensenten

Microsoft erkannte, dass die zur Messung des Erfolgs von bildgebundenen Modellen verwendeten Metriken nicht der menschlichen visuellen Wahrnehmung entsprachen. Also erstellten sie ein visuelles Vergleichstool nebeneinander, das menschliche Bewerter verwendete, um den Erfolg des Modells zu messen.

Lärmmodellierung

Microsoft hat den Ansatz gewählt, mit Bildern hoher Qualität zu beginnen, sie dann durch Hinzufügen von Rauschen zu verschlechtern und dann dem Modell beizubringen, das Bild in seinen ursprünglichen Zustand hoher Qualität zurückzubringen.

Wahrnehmungsverlust und GAN

Dies war Teil der Bemühungen, die Ergebnisse mit der menschlichen Vision in Einklang zu bringen.

In der Ankündigung von Microsoft heißt es:

„… wir haben festgestellt, dass die Optimierung unserer Modelle nur anhand des Pixelverlusts zwischen den Ausgabebildern und den Ground-Truth-Bildern nicht ausreicht, um die optimale Ausgabe zu erzielen, die an der Wahrnehmung des menschlichen Auges ausgerichtet ist.

Als Reaktion darauf haben wir auch Wahrnehmungsverlust und GAN eingeführt und eine optimale gewichtete Kombination der drei Verluste als Zielfunktion festgelegt.

Transformatoren fürs Sehen

Microsoft nutzte die Leistungsfähigkeit von Transformern, die in Sprachmodellen verwendet werden, und konzentrierte sich auf die Verbesserung und das Zoomen.

Dies bedeutet, das Bild zu verbessern und sich auch auf die Skalierung des Bildes zu konzentrieren, was eine schwierige Sache ist.

Im Allgemeinen ist es einfach, ein Bild zu verkleinern. Aber wenn man ein kleines Bild nimmt und es vergrößert, führt dies normalerweise dazu, dass die Artefakte mit niedriger Auflösung des Originalbilds vergrößert werden.

Die Forscher schufen daher ein System, das in der Lage ist, die fehlenden Bilddaten aus dem Bild mit niedrigerer Auflösung zu berechnen und „wiederzugewinnen“ und es auf eine höhere Auflösung zu bringen.

Microsoft nennt den Vorgang des Skalierens eines Bildes DeepZoom.

Edge: 4K-Fernseher von Webbrowsern

Microsoft sieht diese neue KI-Funktion als eine Möglichkeit, das Surfen im Internet mit einem visuellen 4K-Erlebnis zu versehen und Videokonferenzen und ins Internet hochgeladene Familienfotos zu verbessern.

Die Technologie ist bereits in der experimentellen Version von Edge genannt Kanarische Kante.

Die neue Funktion wird in den nächsten Monaten in der Verbraucherversion des Edge-Browsers eingeführt.

Zitieren

Lesen Sie die Ankündigung von Microsoft

Turing-Bild in Superauflösung