Dagliga AI genomgången (AI-robotar lär sig nu genom att titta på människor)

Välkommen, AI-entusiaster.

AI-robotföretaget Figure har precis visat upp en viktig utveckling – deras humanoidrobotar kan nu lära sig att utföra uppgifter självständigt genom att titta på när människor gör det först.

2024 kommer utan tvekan att bli ett galet år för AI och robotteknik. Låt oss sätta igång…

I dagens AI-översikt:

  • Figures humanoida robot lär sig genom att titta på människor
  • Apple ML Research lanserar MLX för AI på enheten
  • Så skapar du produktmodeller med grön skärm med AI
  • V* möjliggör guidad visuell sökning i AI-assistenter
  • 7 nya AI-verktyg och 4 nya AI-jobb
  • Fler nyheter om AI och teknik

Figurs humanoida robot lär sig genom att titta på människor

Beskrivning: AI-robotföretaget Figure visade precis upp sin humanoidrobot Figure 01 som gör en kopp kaffe, vilket den lärde sig efter bara 10 timmar av att se människor slutföra uppgiften via videoträning.

Detaljerna:

  • Figures demo visar hur roboten använder en Keurig för att brygga kaffet och visar upp imponerande fingerfärdighet när den hanterar och placerar den lilla kapseln.
  • Videon visar också en sida vid sida av roboten som kämpar för att direkt placera kapseln innan den till slut lyckas, vilket belyser dess förmåga att självkorrigera.
  • Figure använder en ”end-to-end”-träningsmetod, där systemet observerar människor som utför uppgiften från början till slut och lär sig av data.

Varför det är viktigt: Den imponerande demonstrationen visar på robotteknikens mångsidiga framtidspotential – och dess end-to-end-träning lämpar sig för massiv skalbarhet och anpassningsförmåga, vilket möjliggör ett brett spektrum av verkliga jobb och ständigt förbättrad prestanda.

Apple ML Research lanserar MLX för AI på enheten

Beskrivning: Apples Machine Learning Research-team introducerade i tysthet MLX, ett ramverk med öppen källkod utformat för att effektivisera AI-modellutveckling och distribution på Apple-hårdvara.

Detaljerna:

  • MLX ger avancerade AI-funktioner till Apples senaste kisel, vilket förenklar och förbättrar tekniken i Apples produkter.
  • Ramverket erbjuder välbekanta kodningsverktyg som Python så att utvecklare enkelt kan bygga modeller, med optimering bakom kulisserna för snabbare och mer effektiv modellträning.
  • Med MLX kan användare bygga ett ”mini”-datacenter för LLM på Apples M2- och M3-produkter – och smidigt köra avancerade, intensiva modeller på lokala enheter.
  • Apple ryktas också förbereda en ny version av Siri med AI, som kan behålla konversationsinformation över olika enheter.

Varför det är viktigt: Med sin användarvänliga och optimerade design för Apples kisel representerar MLX ett stort steg mot AI på enheter i Apples ekosystem. Och även om många redan har räknat bort Apple från AI-racet – så kan teknikledaren skaka om saker och ting snabbt år 2024.

Hur man genererar produktmodeller med grön skärm med AI

greenscreen

Beskrivning: Denna Midjourney-prompt kan nu skapa fantastiskt realistiska dator-, telefon- eller produktmodeller, komplett med en grön skärm som enkelt kan anpassas för ditt företag eller din produkt.

Tack till Hugo Ventura (@hugovntr på X) för att han delade med sig av detta arbetsflöde.

Steg för steg:

Öppna Midjourney och skriv /imagine.

Uppmana att generera en bild av någon som håller i/använder en enhet framför en helt grön bakgrund. Till exempel: ”Över axeln tagning av en person framför en helt <color> datorskärm”

Anpassa och justera uppmaningen efter behov för att få bilden precis rätt – exportera sedan och öppna i en redigeringsapp (Photoshop, Canva, etc.) för att ersätta den färgade skärmbakgrunden med dina egna bilder.

Obs – var uppmärksam på reflektioner, t.ex. gröna skärmar som blöder in i andra aspekter av bilden.

V* möjliggör guidad visuell sökning i AI-assistenter

V guidad sök

Beskrivning: Forskare har precis introducerat V*, en AI-driven visuell sökteknik för att effektivt lokalisera objekt i komplexa bilder genom att utnyttja en AI-assistents världskunskap, vilket förbättrar multimodal förståelse.

Detaljerna:

  • Integrering av V* i ett ”Show, Search, and Tell”-system med visuellt minne gav stora noggrannhetsökningar jämfört med kraftfulla multimodala modeller som GPT-4V.
  • I tester matchade V* mänsklig visuell sökningseffektivitet genom att använda liknande kontextuella och målrelaterade ledtrådar.
  • Tekniken förbättrar fasta visuella kodare i multimodala modeller, som vanligtvis saknar detaljer i högupplösta bilder.

Varför det är viktigt: Genom att efterlikna mänskligt styrd sökning kan V* låsa upp mer exakta visuella AI-funktioner – och sannolikt sätta ett slutligt stopp för användbarheten av traditionell CAPTCHA-teknik.

Nya Verktyg & Jobb

  • Bland Turbo- Världens snabbaste AI för konversation (länk)
  • Boundaries- En GPT för att lära sig att säga nej (länk)
  • Invstr- Strömlinjeformat AI-investeringsnav (länk)
  • Brewed- AI-driven skapande av webbappar genom att skriva (länk)
  • McAnswers AI- Effektivisera kodning med AI (länk)

AI Jobb

  • Shield AI- Underhållsingenjör på (länk)
  • OpenAI- Account Director, ChatGPT Enterprise (länk)
  • C3 AI- Direktör, prestandateknik (länk)
  • Anthropic– Policy Communications Lead, Corporate Communications (länk)

SNABBT OCH NYTT

Microsoftchefen Dee Templeton utsågs till observatör utan rösträtt i OpenAI:s styrelse, efter en översyn efter Sam Altmans korta avgång som VD.

Augmental visade en demo av MouthPad, en smart munskyddsenhet som använder subtila tungrörelser för handsfree-navigering i telefonen.

WhiteRabbitNeo öppnade tillgången till sin nya 33B parameter AI-modell för offensiva och defensiva cybersäkerhetsagenter.

Bedrock tillkännagav Gal, en webbintegrerad, AI-förstärkt persondator som gör det möjligt för användare att äga och driva sin egen AI.

Nabla tillkännagav en $ 24M-höjning för sin AI-assistent som genererar medicinska anteckningar och rapporter från läkare-patientkonsultationer, vilket hjälper läkare att spara tid på dokumentation.

Midjourney får kritik efter att en databas med en träningsuppsättning på 16 000 artister läckt ut på nätet, vilket väcker nya etiska frågor om de data som används för deras bildsyntes.

AI-bioteknikstartupen Isomorphic säkrade avtal med läkemedelsjättarna Eli Lilly och Novartis värda uppskattningsvis 3 miljarder dollar, med hjälp av DeepMinds teknik för att screena miljarder föreningar och utforma nya molekyler.

That’s a wrap! Skriv i kommentarerna vetja!

 

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *