AI News

1090

OpenAI lanserar ett Codex‑plugin för Claude Code

OpenAI lanserar ett Codex‑plugin för Claude Code
HN +10 källor hn
claudeopenai
OpenAI har släppt ett Codex‑plugin som ansluter direkt till Anthropic:s Claude Code‑miljö och låter utvecklare kalla på den förstnämnda kodgenereringsmotorn från den senare arbetsflödet. Det öppna källkods‑tillägget, som publicerats på GitHub under openai/codex‑plugin‑cc, lägger till ett “Use Codex”-kommando i Claude Code:s sidopanel, vilket möjliggör kodgranskning med ett klick, refaktoreringförslag och uppgiftsdelegation utan att lämna IDE:n. Detta steg markerar OpenAIs första fördjupning i det plugin‑ekosystem som Claude Code lanserade tidigare i år, en funktion som snabbt blev en grundpelare för team som vill kedja ihop AI‑drivna verktyg. Genom att erbjuda en färdigbyggd brygga hoppas OpenAI bredda Codex‑räckvidden bortom sina egna sandlådor och nå den växande gemenskap som har antagit Claude Code för dess agentiska kodningsförmågor. Integrationen understryker också en sk
898

Claude Codes källkod har läckt via en map‑fil i deras NPM‑register

Claude Codes källkod har läckt via en map‑fil i deras NPM‑register
HN +17 källor hn
anthropicclaude
Anthropics AI‑kodassistent Claude Code exponerades den 31 mars när en sourcemap‑fil som publicerats i projektets npm‑paket avslöjade hela TypeScript‑källkodsträdet – mer än 1 900 filer och en halv miljon rader kod. Säkerhetsforskaren Chaofan Shou, en praktikant på det web3‑inriktade företaget FuzzLand, uppmärksammade problemet på X och påpekade att kartan refererade till en icke‑obfuskerad bucket i Anthropics R2‑lagring och gjorde det möjligt för vem som helst att ladda ner hela kodbasen. Det komprimerade arkivet speglades snabbt på GitHub, där en ögonblicksbild publicerades för ”säkerhetsforskning”. Läckan är viktig av tre skäl. För det första är källkoden Anthropics immateriella egendom; dess offentliga publicering urholkar det konkurrensfördel som företaget byggt upp kring Claude Codes proprietära prompt‑ och exekveringsmotor. För det andra innehåller det exponerade repot interna API:er, byggskript och konfigurationsfiler som kan hjälpa angripare att skapa riktade exploateringar mot verktygets användare. För det tredje understryker händelsen ett återkommande operativt misstag: sourcem
344

Googles TurboQuant påstår stora minnesbesparingar för AI utan att försämra modellkvaliteten

Morning Overview on MSN +7 källor 2026-03-15 news
googlevector-db
Google‑forskare har presenterat TurboQuant, en tvåstegs‑kvantiseringspipeline som minskar det arbetsminne som stora språkmodeller (LLM‑er) kräver med upp till sex gånger samtidigt som utdata­kvaliteten bevaras. Metoden, som beskrivs i ett nytt arXiv‑pre‑print‑papper, använder först PolarQuant – en slumpmässig rotation av datavektorer följt av högupplöst komprimering – och förfinar därefter resultatet med en kvantiserad Johnson‑Lindenstrauss‑transform. Författarna bevisar att den resulterande förvrängningen hålls inom en faktor på 2,7 av det informations‑teoretiska optimumet, vilket innebär att ytterligare minskning skulle bryta mot grundläggande gränser. Genombrottet är viktigt eftersom minne har blivit flaskhalsen för att distribuera allt större modeller i stor skala. Även med framsteg som den 200‑miljonstrukna tidsseriemodellen med 16 k kontext som Google släppte tidigare i år, kräver inferens fortfarande flera gigabyte RAM per instans. TurboQuant‑komprimeringen kan placera samma modell i en bråkdel av det utrymmet, vilket minskar hårdvarukostnaderna, sänker energiförbrukningen och möjliggör on‑device‑ eller edge‑distributioner som tidigare var opraktiska. För molnleverantörer innebär tekniken en direkt ökning av modell‑densiteten per serverrack och en märkbar minskning av driftskostnaderna – ett tema som återkom i vår senaste bevakning av token‑effektivitet där AI‑kostnaderna skars ner med 63 % år 2026. Det som bör hållas ögonen på härnäst är vägen från pre‑print till produktion. Google har redan integrerat TurboQuant i sin interna inferens‑stack, men externa ramverk som PyTorch och TensorFlow kommer att behöva kompatibla kärnor innan den bredare ekosystemet kan ta i bruk tekniken. Företaget har antytt att PolarQuant‑ och Johnson‑Lindenstrauss‑komponenterna kan öppnas som öppen källkod senare i år, vilket skulle kunna sätta igång en våg av tredjepartsverktyg för minnes‑först‑AI‑arkitekturer. Håll utkik efter benchmark‑släpp som jämför TurboQuant‑komprimerade modeller mot referens‑LLM‑er på uppgifter som kodgenerering och multimodal resonemang – resultaten kommer att visa om metoden verkligen omformar ekonomin för storskalig AI.
324

Universal Claude.md – minskar Claudes utdata‑token

Universal Claude.md – minskar Claudes utdata‑token
HN +10 källor hn
agentsclaudestartup
Universal Claude.md – en gemenskaps‑skapad konfigurationsfil som kortar ned Claudes utdata‑token – har lanserats på GitHub och lovar att dämpa den snabba förbrukningen av användningskvoter som många utvecklare har klagat på. Den enkelfils‑mallen “Claude.md”, nu benämnd “Universal Claude.md”, injicerar koncisa prompts, token‑budgetgränser och striktare stopp‑sekvenser i varje Claude Code‑förfrågan, vilket effektivt minskar den genomsnittliga svarslängden med upp till 30 % utan att offra modellens problemlösningsförmåga. Initiativet är viktigt eftersom Claudes generösa token‑tilldelning har blivit ett tveeggat svärd: den möjliggör rik, flerstegs‑resonemang men påskyndar också uttömningen av betalda krediter, särskilt för team som kör flera autonoma agenter. Tidigare i månaden belyste vi hur Claude Code‑agenter kan sprida token‑användning över test‑, gransknings‑ och refaktorings‑loopar. Genom att standardisera ett mer slimmat utdataformat adresserar Universal Claude.md direkt dessa kostnads‑inflationsproblem och kan göra Claude mer attraktivt för startups och företag som noggrant övervakar moln‑AI‑utgifter. Anthropic har inte officiellt godkänt filen, men företagets senaste lansering av Claude Cowork – en macOS‑preview som gör den agentbaserade Claude tillgänglig för alla Claude Max‑prenumeranter – tyder på ett vä
300

Jag skapade ett token‑faktureringssystem för min AI‑agent – så fungerar det

Jag skapade ett token‑faktureringssystem för min AI‑agent – så fungerar det
Dev.to +11 källor dev.to
agentsanthropicopenai
En utvecklare har släppt en fullt fungerande token‑faktureringsmotor som spårar och debiterar varje förfrågan en AI‑agent gör till leverantörer av stora språkmodeller (LLM) såsom OpenAI och Anthropic. Agenten väljer dynamiskt den mest lämpliga modellen för varje uppgift, men den heterogena prissättningen – olika satser för indata respektive utdata, modell‑specifika kostnader och varierande användningsmönster – gjorde fasta prenumerationsavgifter ohållbara. Det nya systemet registrerar det exakta antalet token per anrop, mappar det mot varje leverantörs prislista, aggregerar användning per användare och genererar fakturor i realtid eller drar av från förbetalda saldon. Genombrottet är viktigt eftersom prisbaserad på användning håller på att bli den enda livskraftiga modellen för tjänster som kombinerar flera LLM:er. När företag väver samman ”agentisk AI”-pipelines som omfattar sammanfattning, kodgenerering och dataextraktion, kan dolda token‑kostnader explodera, urholka marginalerna och avskräcka adoption. Genom att exponera detaljerad kostnadsdata ger faktureringsmotorn produktteam den insyn som behövs för att optimera modellval, upprätthålla budgetgränser och erbjuda transparent prissättning till slutanvändare. Den kompletterar också den senaste utvecklingen kring token‑effektivitet – exempelvis kontextmotorn som sparade Claude Code 73 % av sina token – genom att omvandla besparingar till en mätbar ekonomisk fördel. Man kan förvänta sig snabb spridning av tredjepartsplattformar som integrerar liknande huvudböcker, såsom AgentBill.io och Blnks utvecklar‑verktygssats, vilka lovar färdig fakturering och prenumerationshantering. Standarder för token‑redovisning kommer sannolikt att samlas, eventuellt drivet av moln‑marknadsplatser eller öppna konsortier. Regulatorer kan snart granska AI‑relaterad fakturering för rättvisa, särskilt i EU:s kommande AI‑lag. För nordiska startups kan förmågan att fakturera med precision bli en konkurrensfördel när AI‑drivna produkter skalas över gränserna.
300

Anthropic fortfarande i trubbel trots domstolsseger, säger jurister och lobbyister

Anthropic fortfarande i trubbel trots domstolsseger, säger jurister och lobbyister
HN +10 källor hn
anthropic
Anthropics juridiska triumf förra månaden – en federal domare som ogiltigförklarade Pentagonens försök att hindra företagets AI från försvarsupphandlingar – hyllades som en seger för startupen och för bredare frihet inom AI‑industrin. Som vi rapporterade den 30 mars tvingade domen Försvarsdepartementet att dra sig tillbaka från ett generellt förbud som skulle ha uteslutit Anthropics Claude‑modeller från all framtida upphandling. Men lättnaden visade sig kortvarig. Företagets advokater och lobbyister i Washington varnar för att domslutet inte suddar ut en rad andra påtryckningar. En pågående förlikning med Justitiedepartementet, kopplad till påståenden om att Anthropics tidigare licensieringspraxis kränkte tredje‑parts patent, ligger fortfarande i limbo; experter menar att avtalet kan bli en mall för teknikföretag att lösa immaterialrättsliga tvister genom domstols‑pålagda betalningar snarare än privata avtal. Samtidigt förbereder kongresskommittéer höranden om ”AI‑säkerhet och upphandlingsintegritet”, där flera ledamöter redan pekar på Pentagon‑incidenten som bevis för att regeringen behöver striktare tillsyn av privata AI‑leverantörer. Insatserna är höga eftersom resultatet kommer att forma hur snabbt Anthropic kan lansera sin nästa generations‑modell, Mythos, som lovar prestandaförbättringar som kan göra den till en kandidat för hög‑risk‑försvarsapplikationer. Om regulatorer eller lagstiftare inför nya licens‑ eller transparenskrav kan Anthropic tvingas omdesigna sin distributionspipeline, vilket potentiellt fördröjer eller begränsar modellens kommersiella lansering. Håll utkik efter en planerad förlikningskonferens mellan DOJ och Anthropic i början av maj, ett senatkommittémöte för försvarstjänster om AI‑upphandling senare samma månad, samt eventuella FTC‑regelverk om AI‑transparens som kan utvidga granskningen bortom försvarssektorn. Dessa utvecklingar kommer att avgöra om Anthropics domstolsseger blir en varaktig operativ frihet eller bara en tillfällig lättnad.
294

Kod röd hos OpenAI när de “häller pengar ner i ett svart hål”

Kod röd hos OpenAI när de “häller pengar ner i ett svart hål”
HN +9 källor hn
openai
OpenAI har gått in i vad cheferna kallar en “kod röd” finansiell nödsituation och pekar på beräknade förluster på 14 miljarder dollar för 2026, som kan växa till 115 miljarder dollar år 2029. Företaget söker enligt uppgift en ny kapitaltillskott som kan överstiga 100 miljarder dollar, en siffra som skulle överträffa den senaste rundan på 13 miljarder dollar och sätta prov marknadens redan försiktiga hållning till okontrollerade AI‑utgifter. Larmet beror på ett växande gap mellan OpenAIs intäktsströmmar och dess kassaförbrukning. Månatliga ChatGPT‑prenumerationer täcker bara en bråkdel av användarna, medan företagets ambitiösa, beräkningsintensiva projekt – storskalig modellträning, skr
283

Googles 200M‑parameter tidsserie‑grundmodell med 16 k kontext

Googles 200M‑parameter tidsserie‑grundmodell med 16 k kontext
HN +11 källor hn
google
Google Research har presenterat TimesFM‑2.5, en grundmodell med 200 miljoner parametrar för tidsserie‑prognoser som kan ta emot upp till 16 000 datapunkter i ett enda kontextfönster. Modellen, en ren decoder‑arkitektur som tränats på mer än 100 miljarder observationer från verkligheten – inklusive detaljhandelsförsäljning, energiförbrukning och finansiella indikatorer – halverar antalet parametrar jämfört med den ursprungliga TimesFM‑2.0 samtidigt som den ger högre noggrannhet på GIFT‑Eval‑benchmarken för zero‑shot. Ett kvantil‑huvud på 30 miljoner parametrar lägger till inbyggt stöd för kontinuerliga kvantilprognoser över horisonter på upp till 1 000 steg, vilket eliminerar behovet av en separat frekvensindikator. Uppgraderingen är viktig eftersom långsiktiga prognoser traditionellt har krävt antingen enorma modeller eller krånglig feature‑engineering för att fånga avlägsna tidsberoenden. Genom att utöka kontextlängden från 2 048 till 16 384 punkter kan TimesFM‑2.5 direkt modellera säsongsmönster som sträcker sig över månader eller år utan avkortning
245

Pentagons kulturkrigstaktik mot Anthropic har slagit tillbaka

Pentagons kulturkrigstaktik mot Anthropic har slagit tillbaka
HN +10 källor hn
anthropic
En federal domare i Kalifornien utfärdade på torsdag ett tillfälligt föreläggande som stoppar Pentagonens försök att klassificera Anthropics AI‑svit som en ”försörjningskedjerisk” och att förbjuda dess användning i alla försvarsmyndigheter. Beslutet, som beviljades efter en kort förhandling, hindrar Försvarsdepartementet från att utfärda den föreskrift som skulle ha tvingat myndigheterna att ersätta Anthropics verktyg med alternativ från Google, OpenAI och xAI. Åtgärden härrör från en Pentagon‑initierad ”kulturkrigs‑”kampanj som framställde Anthropics teknik som en säkerhetsrisk, trots interna bedömningar som inte fann någon konkret hotbild. Juridiska analytiker beskriver departementets resonemang som ”tveksam juridisk tänkande” som är mer rotat i ideologi än i bevis, och varnar för att föreläggandet kan utlösa en kedja av rättstvister från Anthropic och dess branschallierade. Företagets juridiska ombud har redan signalerat avsikt att stämma Pentagon, Justitiedepartementet och Budget‑ och förvaltningskontoret för vad de kallar ett olagligt ”straff” av en kommersiell leverantör. Föreläggandet är betydelsefullt eftersom det understryker den ökande spänningen mellan USA:s försörjningspolicy för försvar och den snabbt föränderliga AI‑sektorn. Genom att försöka rikta in sig på en enskild leverantör riskerade Pentagon att skapa ett prejudikat för politisk in
236

Neuro‑symbolisk inlärning för prediktiv processövervakning via tvåstegs logik‑tensor‑nätverk med regelbeskärning

ArXiv +6 källor arxiv
healthcare
Ett team av forskare från universitetet i Trento och Norges teknisk‑naturvetenskapelige universitet har publicerat ett nytt arXiv‑pre‑print, “Neuro‑symbolisk inlärning för prediktiv processövervakning via tvåstegs logik‑tensor‑nätverk med regelbeskärning.” Artikeln föreslår en hybridarkitektur som förenar djupa sekvensmodeller med symbolisk logik för att förutsäga nästa steg i affärsprocesser, en förmåga som är central för bedrägeridetektering, övervakning av vårdflöden och riskhantering i leveranskedjor. Kärnan i metoden är en tvåstegs‑pipeline. Först fångar en neural kodare – vanligtvis en transformer eller LSTM – tidsmässiga mönster i händelseloggar. I det andra steget matas den kodade representationen in i ett logik‑tensor‑nätverk som verkställer domänspecifika begränsningar såsom “en betalning måste följa en faktura” eller “en medicindos får inte överstiga en föreskriven gräns.” En ny regelbeskärningsalgoritm tar bort redundanta eller lågpåverkande logiska klausuler, vilket håller modellen både kompakt och tolkbar. Resultat på offentligt tillgängliga händelseloggdataset (t.ex. BPI Challenge 2019 och ett korpus med sjukhusintag) visar en ökning på 5‑7 % i förutsägelse‑noggrannhet jämfört med rena neurala baslinjer, samtidigt som tydliga förklaringar för varje prognos levereras. Varför detta är viktigt är tvådelat. Förbättrad noggrannhet innebär direkt tidigare varningar om bedrägerier eller tidsenliga kliniska insatser, vilket minskar finansiella förluster och patientskador. Ännu viktigare är att det inbäddade symboliska lagret uppfyller regulatoriska krav på spårbarhet: revisorer kan inspektera vilka affärsregler som låg till grund för en förutsägelse, en funktion som rena svart‑låda‑modeller saknar. Metoden pekar också på en bredare övergång mot neuro‑symbolisk AI i operativa miljöer, där efterlevnad och förklarbarhet är icke‑förhandlingsbara. Kommande steg att hålla ögonen på inkluderar en förestående utvärdering på International Conference on Business Process Management, där författarna kommer att jämföra sitt system med de mest avancerade diffusion‑baserade förutsägelsemodellerna som diskuterades i vår artikel den 31 mars om A‑SelecT. Industripilotprojekt med skandinaviska banker och en regional hälso‑myndighet är planerade till Q3, och forskarsamhället kommer att vara nyfikna på om regelbeskärningstekniken kan skalas till de massiva, brusiga loggar som är typiska för verkliga implementationer.
217

Ollama drivs nu av MLX på Apple Silicon i förhandsgranskning

Ollama drivs nu av MLX på Apple Silicon i förhandsgranskning
HN +11 källor hn
applellama
Ollama, den öppen‑källkodsplattform som låter utvecklare köra stora språkmodeller lokalt, har lanserat en förhandsversion som utnyttjar Apples MLX‑ramverk för att ta full nytta av Apple Silicon. Uppdateringen ersätter den generiska CPU‑endast‑bakänden med en MLX‑driven körningsmotor som körs som en separat underprocess och kommunicerar med Ollamas huvudserver via HTTP. Tidiga tester visar en “stor hastighetsökning” på macOS, där inferenslatensen för personliga assistent‑botar som OpenClaw samt kodningsagenter som Claude Code, OpenCode och Codex minskar avsevärt. Flytten är betydelsefull eftersom den demonstrerar hur Apples lågnivå‑maskininlärningsstack kan utnyttjas av tredjepartsverktyg för att leverera AI på enheten som kan konkurrera med molnbaserade tjänster när det gäller svarstid, samtidigt som integriteten bevaras. Genom att utnyttja den förenade minnesarkitekturen och Neural Engine i M‑serie‑chipen minskar MLX behovet av externa GPU:er och sänker energiförbrukningen – viktiga faktorer för utvecklare som riktar in sig på bärbara datorer och stationära datorer som kör AI‑arbetsbelastningar hela dagen. Som vi rapporterade den 30 mars, skiftar Apples bredare AI‑strategi mot modeller på enheten; Ollamas integration är ett konkret exempel på hur den visionen tar form. Det som återstår att bevaka är om MLX‑bakänden går från förhandsgranskning till en standardkomponent i Ollamas kommande stabila version, och hur snabbt andra lokala LLM‑körningsmiljöer antar samma tillvägagångssätt. Apple kan även öppna upp MLX för iOS och iPadOS, vilket skulle bana väg för mobil‑först AI‑assistenter. Prestandamätningar som släpps av Ollama‑teamet kommer att visa om hastighetsvinsterna är tillräckliga för att utmana molnbaserade alternativ, och Apples nästa OS‑uppdatering kan inkludera tätare systemstöd för MLX‑baserad inferens, vilket ytterligare befäster Mac som en hub för privat, högpresterande AI.
204

Jag byggde en kontextmotor som sparar Claude Code 73 % av sina token på stora kodbaser

Jag byggde en kontextmotor som sparar Claude Code 73 % av sina token på stora kodbaser
Dev.to +7 källor dev.to
agentsclaude
En utvecklare som gått över till att bidra till öppen källkod har presenterat en ”kontextmotor” som kraftigt minskar den tokenbudget som Claude Code behöver för att arbeta med omfattande kodarkiv. Rocco Castoro lade upp det Python‑baserade verktyget den 31 mars och visade att Claude Code i ett projekt med 829 filer förbrukade ungefär 45 000 token bara för att hitta rätt kodsnutt. Genom att förindexera kodbasen och bara mata modellen de mest relevanta fragmenten, reducerade motorn den siffran med 73 procent, så att tokenantalet sjönk till omkring 12 000 vid det tredje svaret i en konversation. Genombrottet är viktigt eftersom Claude Codes tokenförbrukning har blivit en flaskhals för team som förlitar sig på modellen för automatiserad kodassistans. Som vi rapporterade den 31 mars nådde Anthropics användningsgränser snabbare än väntat, vilket väckte oro kring kostnad och skalbarhet. Färre token innebär lägre API‑kostnader, snabbare svarstider och en mindre attackyta för oavsiktlig kodläckage – ett hett ämne efter den senaste läckan av Claude‑källkoden via NPM‑registret. Dessutom stämmer motorn väl med Anthropics egna satsning på modeller med längre kontext, såsom den nyss tillkännagivna Claude Opus 4.6, genom att utnyttja det utökade fönstret utan att blåsa upp de råa tokenräkningarna. Det som blir intressant att följa är om Anthropic kommer att integrera tekniken i sin officiella Claude Code‑plugin‑marknad, som lanserades tidigare i månaden, eller erbjuda ett inbyggt ”kontext‑överlämnings‑API”. Antagningsstatistik från den öppna källkodsgemenskapen kommer också att vara avgörande; en ökning av forks eller integrationer kan sätta press på andra LLM‑kodningsagenter att anta liknande indexeringslager. Slutligen kommer utvecklare att vara nyfikna på om tokenbesparingarna leder till lättade användningsgränser eller reviderade prisnivåer, vilket potentiellt kan omforma ekonomin för AI‑driven mjukvaruutveckling i Norden och bortom.
195

# OpenAI    # ChatGPT   Chatt‑höjdpunkter

Mastodon +11 källor mastodon
dall-egooglegpt-4openai
OpenAI har utökat räckvidden för sin flaggskepps‑chatbot genom att lansera en officiell ChatGPT‑bot på Telegram och släppa en uppdaterad Android‑app som levereras med företagets senaste multimodala modell, GPT‑4o. Telegram‑boten, som nås via @OpenAI_chat_GPTbot‑handtaget, låter användare anropa ChatGPT, DALL‑E 3 och den nya röstassistenten “Lucy” direkt från vilken chatt som helst, medan Android‑klienten, som nu har 4,7‑stjärnig rating på Google Play, erbjuder röstinteraktion på enheten, bildgenerering och sömlös inloggning med befintliga OpenAI‑konton. Detta är första gången OpenAI erbjuder en inbyggd åtkomstpunkt till sina modeller på en mainstream‑meddelandeplattform utan krav på inloggning. Genom att integrera tjänsten i Telegram – en plattform med över 700 miljoner aktiva användare – kringgår OpenAI friktionen som följer med enbart webb‑baserad åtkomst och når en global publik som föredrar snabba, konversationsbaserade verktyg. Android‑utgåvan konsoliderar samtidigt företagets satsning på mobil‑först AI och positionerar ChatGPT som en daglig produktivitetsassistent snarare än en nischad webbapp. Branschobservatörer ser expansionerna som ett testbädd för bredare intäktsstrategier. Tidiga användare experimenterar redan med den nya grupp‑chatt‑funktionen, som låter flera deltagare samarbeta med modellen i realtid – en möjlighet som OpenAI framhäver som en katalysator för team‑brainstorming, kodgranskning och pedagogisk handledning. Samtidigt sprider rykten om en kommande GPT‑5, i ryska forum beskriven som “fri och obegränsad”, spekulationer om en snabb uppgraderingscykel som kan komprimera gapet mellan forskningsprototyper och konsument‑klassad AI. Vad att hålla ögonen på härnäst: utrullning av Telegram‑boten till fler språk och regioner, prisjusteringar för premiumfunktioner såsom högupplösta DALL‑E‑utdata, samt eventuell officiell bekräftelse av GPT‑5:s tidplan. Lika kritiskt blir hur OpenAI hanterar dataskydd och moderering i dessa mer öppna, real‑tids‑miljöer, en faktor som kan forma regulatorisk granskning i Europa och Norden.
192

📰 Universal Claude Token‑effektivitet sänker AI‑kostnaderna med 63 % år 2026 – Ett banbrytande verktyg med öppen källkod

📰 Universal Claude Token‑effektivitet sänker AI‑kostnaderna med 63 % år 2026 – Ett banbrytande verktyg med öppen källkod
Mastodon +10 källor mastodon
claudeopen-source
Universal Claude.md, en öppen‑källkod ”drop‑in”-fil som släppts på GitHub, minskar antalet utmatningstoken för Anthropics Claude‑modeller med ungefär 63 %. Arkivet, som publicerats under namnet *claude-token‑efficient*, fungerar utan någon kodändring: utvecklare lägger helt enkelt till markdown‑filen i ett projekt så blir Claudes svar märkbart mindre utförliga, de blir av med smickrande formuleringar, överflödig formatering och fyllnadstext. Minskningen är viktig eftersom Claudes prissättning är token‑baserad, och även om inmatningstoken dominerar fakturan, utmatningstoken utgör fortfarande en betydande del för långformatuppgifter som kodgenerering, dokumentation eller analytiska sammanfattningar. Genom att korta ner den genomsnittliga svarslängden kan Universal Claude.md, enligt gemenskapsbenchmarkar, reducera de månatliga driftskostnaderna för tunga användare med upp till två‑tredjedelar. Effektivitetsvinsten innebär också snabbare genomloppstider, eftersom färre token innebär lägre inferenslatens och mindre minnes
190

Populär Twitter‑användare “förklarar” hur Sam Altmans OpenAI kan ha orsakat den värsta konsument‑hårdvarukrisen med beställningar som aldrig var verkliga – The Times of India

Mastodon +12 källor mastodon
openai
En populär Twitter‑tråd har väckt ny debatt om OpenAIs roll i den pågående konsument‑hårdvarukrisen. Inlägget, skrivet av en välkänd teknikkommentator, hävdar att företagets ”letter of intent” från oktober 2025 med Samsung och SK Hynix – som lovade upp till 900 000 DRAM‑wafers per månad, ungefär 40 % av den globala produktionen – felaktigt tolkades som bindande inköpsorder. Enligt tråden ledde denna missuppfattning till spekulation på marknaden, vilket fick distributörer och OEM‑företag att säkra lager och driva RAM‑priserna till rekordnivåer, en uppgång som mer än fyrdubblat kostnaderna för spelare, datacenteroperatörer och vanliga PC‑användare. Anklagelsen är viktig eftersom den belyser hur AI‑hype kan sprida sig till orelaterade leveranskedjor. Träning av dagens mest avancerade modeller, såsom OpenAIs GPT‑5.4, kräver enastående minnesbandbredd, vilket får företag att signalera storskaliga inköp långt innan kontrakt skrivs under. När dessa signaler förstärks av media och investerare kan de skapa artificiell knapphet, driva upp priserna och belasta tillverkare som redan kämpar med chipbrist efter pandemin. För konsumenterna blir följderna påtagliga: längre väntetider på bärbara datorer, högre uppgraderingskostnader och trängre marginaler för molnleverantörer som förenar prisökningar på slutanvändarna. Det som nu är att bevaka är huruvida OpenAI kommer att ge en formell förklaring av statusen för Samsung‑ och Hynix‑avtalen samt hur de två chipstillverkarna svarar. Regulatorer kan också undersöka om sådana framåtblickande uttalanden utgör marknadsmanipulation, särskilt i takt med att EU och USA skärper tillsynen av AI‑relaterade leveranskedjeupplysningar. Slutligen kommer branschobservatörer att följa om andra AI‑laboratorier dämpar sina inköpsannonser, vilket potentiellt kan omforma efterfrågekurvan för högbandbreddsmemory och förhindra en upprepning av den nuvarande hårdvarububblan.
185

OpenAI Codex‑sårbarhet gjorde det möjligt för angripare att stjäla GitHub‑token

Mastodon +12 källor mastodon
openai
OpenAI:s kodgenereringsmotor Codex innehöll en dold Unicode‑kommandoinjektionsbrist som kunde triggas via skadliga Git‑gren‑namn, vilket gjorde det möjligt för angripare att stjäla GitHub‑personliga åtkomst‑token. Säkerhetsforskare avslöjade att sårbarheten beror på Codex automatiska tolkning av gren‑identifierare när den föreslår kodändringar. Genom att bädda in en speciellt utformad Unicode‑sekvens kan en motståndare injicera ett skal‑kommando som körs på utvecklarens maskin eller CI‑runner, läser den lagrade token och exfiltrerar den till en fjärrserver. Bristen var aktiv i standard‑Codex‑konfigurationen som används av många IDE‑plugin‑program samt av OpenAI:s egen Codex‑drivna GitHub‑integration. Intrånget är betydelsefullt eftersom en stulen token ger full läs‑ och skrivbehörighet till en användares repositorier, hemligheter och arbetsflödes‑filer, vilket öppnar dörren för leveranskedjeattacker som kan kompromettera nedströmsprojekt. Incidenten följer en våg av AI‑relaterade prompt‑injektionsattacker – såsom “PromptPwnd”‑attackerna mot GitHub Actions och Shai‑Hulud 2.0‑leveranskedjekampanjen – och understryker hur AI‑assistenter kan bli en oväntad attackyta i DevOps‑pipelines. OpenAI har släppt en akut patch som sanerar gren‑namn och inaktiverar den sårbara kodvägen, och uppmanar utvecklare att uppdatera till den senaste Codex‑versionen, rotera alla exponerade token och granska senaste commits för obehöriga ändringar. Företaget har också lovat ett formellt säkerhetsmeddelande och ett CVE‑identifieringsnummer inom de närmaste dagarna. Vad som blir intressant att följa härnäst: om OpenAI kommer att utvidga fixen till andra modeller som delar samma parslogik, hur snabbt konkurrerande verktyg som GitHub Copilot och Google Gemini adresserar liknande risker, samt om regulatorer kommer att kräva striktare säkerhetsstandarder för AI‑kodassistenter. Händelsen förväntas påskynda granskningen av AI‑drivna utvecklingsverktyg och driva leverantörer mot mer robust inmatningsvalidering och hårdare leveranskedjor.
180

📰 LLM Buyout Game Benchmark 2026: Hur GPT‑5.4 överlistade GLM‑5 i AI‑strategiduellen

📰 LLM Buyout Game Benchmark 2026: Hur GPT‑5.4 överlistade GLM‑5 i AI‑strategiduellen
Mastodon +12 källor mastodon
benchmarksgpt-5
OpenAI:s senaste flaggskepp, GPT‑5.4, har tagit förstaplatsen i 2026 års LLM Buyout Game Benchmark och passerat Huawei‑stödda GLM‑5 i en flerrundig duell som simulerar koalitionspolitik, höginsatssfinansiella förhandlingar och överlevnad i slutskedet. I benchmarken ställs modeller mot varandra med olika startbalanser, en gemensam prispott och obegränsade “bakdörrs‑avtal”, vilket tvingar varje system att balansera aritmetisk precision, förtroendeskapande och strategisk risk‑tagning. GPT‑5.4:s “skeptiska bankir”‑persona krävde bevis innan någon transaktion och utnyttjade sitt utökade kontextfönster på en miljon token för att förutsäga motståndarens drag, vilket i slutändan säkrade en avgörande koalition och överlistade GLM‑5:s mer aggressiva förhandlingsstil. Vinsten är betydelsefull eftersom Buyout‑spelet är ett av de få offentliga testerna som stress‑testar LLM‑modeller under realistiska ekonomiska påtryckningar snarare än isolerade språkuppgifter. GPT‑5.4:s triumf visar OpenAI:s framsteg i att integrera inbyggda datoranvändningsfunktioner – att klicka, skriva och interagera med applikationer via Playwright – i en enda modell, ett språng från GPT‑5.2:s 47 % OSWorld‑resultat till 75 % i år. För företag signalerar resultatet att framtida AI‑assistenter inte bara kan utarbeta kontrakt utan även verkställa dem autonomt, vilket kan omforma inköp, fusioner och förvärv samt till och med förvaltning av statliga förmögenhetsfonder. GLM‑5, som släpptes tidigare 2026 med en 754 miljard‑parameter mixture‑of‑experts‑arkitektur och en MIT‑liknande licens, förblir en stark konkurrent på kod‑ och industriella benchmarkar, men dess prestation i den strategiska arenan halkade efter OpenAI:s nya aritmetik‑drivna resonemang. Klyftan understryker en bredare förändring: framgång kommer att mätas lika mycket på en modells förmåga att förhandla och hantera resurser som på ren språklig flyt. Att hålla ögonen på nästa steg inkluderar den kommande “Strategic Alliance”-utvidgningen av Buyout‑spelet, planerad till Q3, där modellerna kommer att möta tvärindustriella regulatoriska begränsningar. Analytiker kommer också att följa OpenAI:s färdplan för GPT‑5.5, som ryktas innehålla realtids‑datainmatningar, samt Huaweis svar – möjligen en GLM‑5.2 med förbättrade koalitionsbyggande moduler. Tävlingen om att integrera ekonomiskt handlingsutrymme i LLM‑modeller accelererar, och nästa benchmark kan återigen rita om den konkurrensmässiga kartan.
169

God morgon! Jag önskar dig en underbar dag! Den ursprungliga bilden och prompten finns här:

Mastodon +12 källor mastodon
En digital konstnär har väckt en ny våg av uppmärksamhet på plattformen PromptHero genom att publicera en AI‑genererad illustration med titeln ”God morgon! Jag önskar dig en underbar dag!”. Verket, som föreställer en stiliserad tecknad flicka som håller i en kaffekopp framför en soluppgång, skapades med den öppna källkod‑modellen Flux AI och åtföljdes av en offentligt delad prompt‑länk (https://prompthero.com/prompt/2383825d754). Inom några timmar hade bilden samlat tusentals gillningar och en kaskad av återdelningar på Twitter, Instagram och nischade AI‑konst‑forum, där användare märkte inlägget med #fluxai, #AIart, #generativeAI och liknande community‑hashtags. Händelsen illustrerar hur verktyg för generativ bildskapande rör sig från experimentella laboratorier till vardaglig visuell kommunikation. Flux, en diffusionsmodell som släpptes tidigare i år, prisas för sin högupplösta output och relativt låga beräkningskostnad, vilket gör den tillgänglig för hobbyister och små studior. Genom att publicera den exakta prompten bjuder skaparen in till replikering och remix, vilket förvandlar verket till en de‑facto‑mall för ”god‑morgon”-hälsningar som kan anpassas med olika motiv eller stilar. Denna öppna‑prompt‑kultur påskyndar kunskapsdelning men väcker också frågor om originalitet, attribution och den potentiella mättnaden av liknande innehåll i sociala flöden. Branschobservatörer kommer att följa om plattformar som PromptHero inför ursprungsmetadata eller licensalternativ för att skydda kreatörernas bidrag. Samtidigt kan den ökande mängden AI‑genererade gratulationskort driva traditionella grafiska design‑tjänster att anta hybrida arbetsflöden som kombinerar mänsklig styrning med modellbaserad rendering. De kommande veckorna kan även se varumärken experimentera med AI‑konst på begäran för marknadsföringskampanjer, för att testa om nyheten med omedelbart genererade, personligt anpassade visuella element omvandlas till mätbar engagemang. Allteftersom gemenskapen förfinar prompt‑engineering och modellfinjustering kommer gränsen mellan skräddarsydd illustration och algoritmisk output fortsätta att suddas ut.
160

Nytt IAEA‑forskningsprojekt använder maskininlärning för att bättre förutsäga polymerförändringar under strålning

Nytt IAEA‑forskningsprojekt använder maskininlärning för att bättre förutsäga polymerförändringar under strålning
International Atomic Energy Agency +10 källor 2026-03-23 news
Den Internationella atomenergiorganisationen (IAEA) har lanserat ett samordnat forskningsprojekt som ska tillämpa maskininlärning på den långvariga utmaningen att förutsäga hur joniserande strålning förändrar polymerstrukturer. IEAAs förfrågan om förslag, som offentliggjordes denna vecka, bjuder in universitet, nationella laboratorier och industripartners att utveckla datadrivna modeller som kan förutsäga kedjebrott, tvärbindning och sprödhet i det breda spektrum av polymerer som används i kärnreaktorer, medicintekniska produkter, rymdhårdvara och behållare för radioaktivt avfall. Strålningsinducerad nedbrytning är ett kritiskt tillförlitlighetsproblem: polymertätningar, kabelmantlar och skärmfolie kan gå sönder oväntat, vilket leder till kostsamma avstängningar eller säkerhetsincidenter. Traditionella metoder bygger på tidskrävande experiment och fysikbaserade simuleringar som har svårt att fånga den komplexa kemin i högenergetiska partikelinteraktioner. Genom att träna algoritmer på befintliga nedbrytningsdatamängder samt på nya mätningar som genereras inom projektet, siktar forskarna på att skapa förutsägande verktyg som körs på minuter i stället för veckor, vilket gör det möjligt för konstruktörer att tidigt screena material och planera utbytesscheman med större säkerhet. IAEAs initiativ sammanfaller med en bredare satsning på att integrera artificiell intelligens i kärnteknik, och speglar nyliga arbeten med förstärkningsinlärningsförbättrade simuleringar samt neuro‑symboliska modeller för processövervakning. En lyckad implementering skulle kunna påskynda införandet av strålningsresistenta polymerer, minska underhållskostnaderna för kraftverk och förbättra hållbarheten hos medicinska implantat som används i strålbehandlingsmiljöer. Håll utkik efter deadline för projektsökande, som är planerad till slutet av maj, samt det första konsortie‑tillkännagivandet som förväntas på hösten. Kommande milstolpar inkluderar publiceringen av en öppen databas för polymer‑strålning, benchmark‑modeller för maskininlärning och pilotvalideringsstudier i driftande reaktorer och sjukhusmiljöer. Resultaten kommer sannolikt att påverka framtida IAEA‑säkerhetsriktlinjer och kan sätta en ny standard för AI‑driven materialteknik inom kärnsektorn.
158

RE: https:// mastodon.social/@wearenew_publ ic/116324535438933195 🖋️ Vi är stolta över att ha tod

RE:   https://  mastodon.social/@wearenew_publ  ic/116324535438933195    🖋️ Vi är stolta över att ha tod
Mastodon +11 källor mastodon
En nordisk aktivistkollektiv känd som WeAreNew Public meddelade på Mastodon att den formellt har stött den nyutgivna Pro‑Human AI Declaration. Gruppen, som bildades 2018 för att motverka det dess grundare beskrev som ”missbruk av mänskliga rättigheter av teknikföretag”, sade att deklarationens principer överensstämmer med dess långvariga uppdrag att skydda värdighet, integritet och demokratiskt deltagande i en era av allt mer autonoma system. Pro‑Human AI Declaration utarbetades förra månaden av en koalition av NGO:s, akademiska forskare och tidigare beslutsfattare från hela Europa och Nordamerika. Den kräver obligatorisk transparens i algoritmiskt beslutsfattande, verkställbara begränsningar av biometrisk övervakning och en juridisk rätt för individer att bestrida automatiserade resultat. Genom att skriva under går WeAreNew Public med i mer än 70 organisationer som har lovat att hålla regeringar och företag ansvariga för dessa standarder. Stödet är betydelsefullt eftersom det tillför en högljudd, gräsrotsröst från den nordiska regionen till en debatt som redan formar Europeiska unionens
154

Lär dig Claude Code genom att göra, inte läsa

Lär dig Claude Code genom att göra, inte läsa
HN +11 källor hn
claude
Anthropic har lanserat en praktisk lärandeupplevelse för Claude Code, deras AI‑drivna kodassistent, som låter användare börja koda direkt i produkten utan någon lokal installation eller förkunskaper i programmering. Tutorialen “Lär dig Claude Code genom att göra, inte läsa”, som släpptes den här veckan, ersätter traditionell dokumentation med en interaktiv kurs som guidar lärande genom verkliga uppgifter – automatisering av kalkylblad, generering av rapporter och refaktorering av kodsnuttar – direkt i Claude Code‑gränssnittet. Detta steg är viktigt eftersom det sänker inträdesbarriären för ett verktyg som hittills främst har tilltalat utvecklare som är bekväma med kommandoradsgränssnitt och plugin‑ekosystem. Genom att avskaffa behovet av att installera CLI eller konfigurera externa redigerare vill Anthropic locka icke‑tekniska yrkesverksamma som kan dra nytta av AI‑assisterad automatisering. Metoden speglar också en bredare branschtrend mot erfarenhetsbaserat lärande och återkallar liknande initiativ från OpenAIs Codex‑plugins och GitHub Copilots “learn by coding”-laboratorier. Anthropics strategi bygger på den senaste rapporteringen om Claude Codes ekosystem, inklusive det CLI‑kvot‑dränerande felet som rapporterades den 30 mars och den Codex‑
144

Claude Code‑användare når användningsgränser “mycket snabbare än förväntat”

Claude Code‑användare når användningsgränser “mycket snabbare än förväntat”
HN +5 källor hn
anthropicclaude
Anthropic’s Claude Code, företagets AI‑drivna kodassistent, tar slut på sin kvot långt tidigare än vad användarna förväntade sig. Inom några dagar efter lanseringen i mars 2026 får utvecklare i Norden och resten av världen meddelanden om “Claude usage limit reached”, ofta redan efter några hundra token‑förfrågningar. Varningsskärmen visar en nedräkning till nästa återställning, vilket lämnar team mitt i en sprint och tvingar dem att snabbt hitta alternativa lösningar. Den plötsliga uttömningen är betydelsefull eftersom Claude Code marknadsfördes som ett kostnadseffektivt alternativ till konkurrenter som GitHub Copilot och OpenAI:s Code Interpreter, med ett Claude Pro‑abonnemang på 200 USD per år som lovade generösa token‑tilldelningar. Företag som tidigt antagit verktyget rapporterar stoppade pull‑requests, trasiga CI‑pipelines och en ökning av supportärenden, vilket tvingar vissa att återgå till manuella kodgranskningar eller byta verktyg mitt i ett projekt. Problemet hotar dessutom Anthropics trovärdighet efter en rad säkerhetsrelaterade bakslag – inklusive det NPM‑källkodsläckage som rapporterades tidigare i månaden – genom att belysa klyftan mellan lovad prestanda och den faktiska driftsituationen. Anthropic’s Lydia Hallie bekräftade på X att problemet är en “top priority” och att ingenjörer “aktivt undersöker” saken. Företaget har ännu inte avslöjat någon rotorsak, men branschinsiders pekar på en möjlig cache‑bug som blåser upp token‑räkningen med 10‑20 % samt en nyligen justerad gräns för top‑hour‑rate‑limits som oavsiktligt kan ha sänkt per‑användar‑kapaciteten. Ett fåtal användare har redan observerat att token‑förbrukningen skjuter i höjden när Claude Code automatiskt utökar kontextfönstret för att inkludera hela kodarkivet – en funktion som framhölls i vår artikel den 31 mars om en kontextmotor som sparade 73 % av token‑användningen i stora kodbaser. Vad man bör hålla ögonen på härnäst: Anthropic förväntas publicera en detaljerad post‑mortem och kan inom de kommande två veckorna införa tillfälliga kvot‑förlängningar eller en reviderad prisnivå. Konkurrenterna kommer sannolikt att utnyttja situationen och marknadsföra mer förutsägbara användningsmodeller. Utvecklare bör följa Anthropics meddelanden på utvecklarportalen och överväga reservverktyg tills mysteriet med den snabba kvot‑utarmningen är löst.
135

claude-code/src/utils/userPromptKeywords.ts på 642c7f944bbe5f7e57c05d756ab7fa7c9c5035cc · chatgptprojects/claude-code

claude-code/src/utils/userPromptKeywords.ts på 642c7f944bbe5f7e57c05d756ab7fa7c9c5035cc · chatgptprojects/claude-code
Mastodon +11 källor mastodon
claude
En ny commit i det öppna källkods‑projektet Claude‑Code har infört ett svordomsfilter i verktygets pipeline för bearbetning av användar‑promptar. Ändringen, som gjordes i filen `src/utils/userPromptKeywords.ts` i commit 642c7f944bbe5f7e57c05d756ab7fa7c9c5035cc, lägger till ett reguljärt uttryck – `negativePattern` – som matchar ett brett spektrum av vulgäriteter och stötande fraser såsom “wtf”, “omfg”, “shit”, “dumbass” och “what the hell”. När en användares prompt innehåller något av dessa uttryck kommer Claude‑Code nu att flagga eller avvisa begäran innan den når den underliggande språkmodellen. Detta steg speglar ett växande fokus på säkerhet och innehållsmoderering i AI‑stödda utvecklingsverktyg. Claude‑Code, ett community‑drivet omslag runt Anthropics Claude‑modell som är inriktat på kodgenerering, har hyllats för sin flexibilitet men också granskats för ibland återge den ton som användarna själv använder. Genom att filtrera bort svordomar redan i prompt‑stadiet syftar projektet till att minska spridningen av fientligt språk, reducera risken för missbruk av modellen och anpassa sig till framväxande branschstandarder som kräver ansvarsfull AI‑beteende. Ändringen signalerar också att även nischade, utvecklar‑centrerade AI‑projekt inför samma skyddsåtgärder som större plattformar har implementerat. Utvecklare bör följa hur filtret rullas ut i nästa version av Claude‑Code och om underhållarna väljer att utöka det för att omfatta andra former av toxiskt innehåll, såsom hatpropaganda eller otillåtna instruktioner. Gemenskapens respons – huruvida regex‑uttrycket uppfattas som överdrivet eller som ett nödvändigt steg – kommer att forma framtida modereringspolicyer. Dessutom kan uppdateringen inspirera andra öppna AI‑verktyg att införa liknande skydd, vilket potentiellt leder till en bredare konvergens kring grundläggande säkerhetsstandarder i AI‑kodnings‑ekosystemet.
128

📰 Claude Code‑källkoden läckte: Anthropics AI‑system avslöjades 2026 (Detaljerad analys)

Mastodon +11 källor mastodon
anthropicclaude
Anthropics Claude Code, företagets flaggskepps‑AI‑assisterade kodningsassistent, exponerades den 31 mars 2026 när en 59,8  MB‑stor sourcemap av misstag publicerades i det offentliga npm‑registret och avslöjade hela TypeScript‑källkoden. Källkartsfilen listade 1 884 källfiler, inklusive interna moduler, konfigurationsskript och en tidigare okänd “KAIROS”‑bakgrundsmotor som kör en “autoDream”‑rutin för att rensa och omorganisera minnet medan användaren är inaktiv. Läckan upptäcktes först av forskaren Chaofan Shou, som flaggade paketet på X och initierade en snabb nedladdning av repot. Inom några timmar speglades Claude Code‑ögonblicket på GitHub, vilket utlöste en våg av analyser från säkerhetsexperter och AI‑utvecklare. Anthropic bekräftade misstaget, tog bort det felaktiga paketet och utfärdade ett kort uttalande där de bad om ursäkt för den “oavsiktliga exponeringen av proprietär kod”. Varför läckan är viktig sträcker sig bortom en enskild produkt. Claude Code är en kärnkomponent i Anthropics strategi för att konkurrera med OpenAIs Codex och Microsofts Copilot, och källkoden avslöjar designval kring modellstyrning, sandboxing och KAIROS‑underdelen som kan ge konkurrenter insikter för egna implementationer. Säkerhetsinriktade observatörer påpekar att incidenten belyser hur skör leveranskedjan är inom AI‑branschen; ett enda felkonfigurerat byggartefakt kan avslöja både immateriella rättigheter och potentiella attackytor, såsom odokumenterade API:er eller felsökningskrokar. Framåt ser man sannolikt en accelererad granskning från regulatorer i EU och de nordiska länderna, där ramverk för AI‑säkerhet och dataskydd skärps. Anthropic förväntas publicera en formell incident‑responsrapport, beskriva åtgärder för att åtgärda problemet och eventuellt stärka sina CI/CD‑pipelines med automatiserad borttagning av sourcemaps. Konkurrenter kan också granska den läckta koden för sårbarheter de kan utnyttja eller för idéer som snabbar på deras egna utvecklingscykler. Intressenter bör hålla utkik efter: en formell post‑mortem från Anthropic, eventuella juridiska anspråk från partners eller kunder som hänvisar till brott mot sekretess, samt framväxten av patchar eller community‑drivna fork‑projekt som försöker stärka de exponerade komponenterna. Claude Code‑läckan fungerar som en varningshistorik om att även ledande AI‑labbar måste behandla mjukvaruleveranskedjor med samma noggrannhet som de tillämpar på modell‑säkerhet.
127

OrboGraph vinner 2026 års pris för artificiell intelligens i bedrägeridetektion och -förebyggande

OrboGraph vinner 2026 års pris för artificiell intelligens i bedrägeridetektion och -förebyggande
Las Vegas Sun +13 källor 2026-03-28 news
OrboGraph, det AI‑företag med bas i Burlington som driver bedrägeridetektion för check‑ och insättningar för banker och kreditföreningar, har utsetts till vinnare i 2026 Artificial Intelligence Excellence Awards. Business Intelligence Group delade ut priset i kategorin Bedrägeridetektion och -förebyggande och hänvisade till företagets mätbara påverkan på att minska check‑insättningsbedrägerier genom en svit av djupinlärningsmodeller, realtids‑anomalisklassificering och automatiserad ärendetriage. Priset är betydelsefullt eftersom det bekräftar OrboGraphs metod i en tid då finansiella institutioner står under ökande press att begränsa förluster från allt mer sofistikerade bedrägerischeman. Enligt företaget har plattformen redan hjälpt kunder att minska bedrägliga insättningar med upp till 45 % samtidigt som utredningstiden har halverats. Sådana resultat omvandlas till direkta kostnadsbesparingar och lägre falsk‑positiva andelar, ett bestående problem för äldre regelbaserade system. Erkännandet placerar dessutom OrboGraph bredvid större AI‑aktörer – såsom Mastercards Decision Intelligence och Visas Advanced Authorization – och visar att nischade, skräddarsydda lösningar kan konkurrera på både effektivitet och verkningsgrad. Framåt ser OrboGraph fram emot att lansera en nästa‑generationsversion av sin motor som integrerar multimodala data, inklusive bildanalys av checkar och röstbiometri från mobila insättningar. Analytiker kommer att bevaka nya integrationer med kärnbankplattformar samt
125

GitHub - concensure/Semantic: Semantisk analys

Mastodon +7 källor mastodon
agents
Ett nytt open‑source‑projekt med namnet **Semantic** har dykt upp på GitHub och lovar att minska de så kallade ”agent‑looparna” som plågar stora språkmodells‑ (LLM‑) drivna assistenter med ungefär 28 %. Förrådet, som publicerats av concensure‑teamet, beskriver en teknik som översätter programkod till abstrakta syntaxträd (AST)‑logikgrafer och sedan tillämpar statiska analysregler för att upptäcka och bryta repetitiva resonemangscykler som LLM‑agenter ofta fastnar i när de försöker lösa kodningsuppgifter. Agent‑loopar uppstår när en LLM upprepade gånger anropar samma deluppgift – exempelvis att refaktorera ett kodstycke, återkontrollera en typ eller generera ett test på nytt – utan att göra någon framsteg. Den resulterande “churnen” slösar beräkningscykler, ökar svarstiden och kan driva upp molnkostnaderna för tjänster som integrerar LLM:er i CI‑pipelines eller IDE‑tillägg. Genom att utnyttja AST‑baserade representationer kan Semantic resonera om kodens struktur utan att återkommande anropa modellen, och därmed beskära onödiga iterationer innan de ens startar. Metoden bygger på tidigare arbete inom statisk kodanalys och det Haskell‑baserade “semantic”-biblioteket som parsar och jämför källkod över språk. Vad som särskiljer detta initiativ är dess fokus på att föra tillbaka analysen till LLM‑prompt‑logiken, vilket i praktiken ger modellen en ”semantisk genväg” som minskar antalet anrop som krävs för att nå ett korrekt svar. Tidiga benchmark‑resultat som publicerats i förrådet visar en minskning på 27,78 % av totala API‑anrop för en uppsättning vanliga programmeringsutmaningar, vilket omvandlas till mätbara kostnadsbesparingar för utvecklare som förlitar sig på verktyg som GitHub Copilot eller skräddarsydda AI‑agenter. Projektet har redan väckt diskussion på Hacker News, där praktiker debatterar dess skalbarhet och möjligheten att integrera AST‑logikgraferna i befintliga LLM‑orkestreringsramverk. Kommande steg att hålla ögonen på inkluderar en formell, peer‑reviewad utvärdering, potentiell adoption av molnbaserade AI‑leverantörer samt community‑bidrag som utökar språkstödet bortom den nuvarande prototypen. Om påståendena håller, kan Semantic bli en nyckelkomponent i den framväxande verktygslådan för att göra LLM‑drivna utvecklingsassistenter både snabbare och billigare.
120

Recension av Apple AirPods Max 2: En betydligt större uppgradering än jag förväntade mig

Mastodon +7 källor mastodon
apple
Apple har presenterat den andra generationens AirPods Max, och de första praktiska intrycken tyder på att uppgraderingen är betydligt mer omfattande än de blygsamma visuella förändringarna som först fångade uppmärksamheten. De nya omgivande hörlurarna behåller den ikoniska rostfria stålramen och den nätliknande kåpan från 2020‑modellen, men under ytan rymmer de Apples senaste H2‑chip, en omarbetad drivararkitektur och ett batteri som nu ger upp till 30 timmars lyssning med aktiv brusreducering (ANC) påslagen. Apple prissätter Max 2 till 649 USD i USA, vilket placerar den ett steg över originalets 549 USD, och lovar ”branschledande” ljudkvalitet, adaptiv ANC som reagerar på trycket i öronkåpan samt sömlös överlämning mellan iPhone, iPad, Mac och Vision Pro‑enheter. Betydelsen av lanseringen sträcker sig längre än en enkel uppfräschning. Genom att kombinera H2‑chipet med spatialt ljud som nu utnyttjar maskininlärning på enheten för realtids‑huvudspårning, förvandlar Apple sina premiumhörlurar till ett nav för uppslukande mediekonsumtion och fjärrsamarbete – områden där konkurrenter som Sony och Bose traditionellt har dominerat. Uppgraderingen förstärker också Apples bredare strategi att fördjupa ekosystemets låsning: Max 2 aktiverar automatiskt ”Find My”‑aviseringar, stödjer ultrabredbands‑överlämning och integreras med den kommande iOS 18‑sviten ”Personal Audio” som lovar AI‑drivna ljudprofiler. För en marknad som de senaste två åren har sett få verkligt differentierade over‑ear‑lanseringar, kan Apples drag återställa förväntningarna på pris, prestanda och mjukvarusymbios. Det som bör hållas ögonen på härnäst är Apples utrullningsschema – global tillgänglighet startar nästa vecka, med en begränsad färgkollektion planerad för helgsäsongen. Analytiker kommer att följa om det premiumprissatta erbjudandet triggar ett priskrig eller får konkurrenterna att påskynda sina egna AI‑förstärkta ljudprodukter. Firmware‑uppdateringar under de kommande månaderna kan låsa upp ytterligare funktioner för spatialt ljud, och den kommande lanseringen av Vision Pro kan göra Max 2 till den standardiserade ljudpartnern för mixed‑reality‑upplevelser.
120

📰 LongCat‑AudioDiT 2026: Banbrytande diffusion‑TTS med nollskotts‑röstkloning LongCat‑AudioD

Mastodon +12 källor mastodon
huggingfacespeechvoice
LongCat‑AudioDiT, som presenterades den här veckan av den finska startupen LongCat AI, tar text‑till‑tal (TTS) in i ett nytt regime genom att generera ljud direkt i ett latent vågformsutrymme med en diffusion‑transformer. Modellen, tränad på ett mångsidigt flerspråkigt korpus, kan klona en osedd talares timbre från så lite som tre sekunders referensljud och producera tal som får poäng över 0,90 på standardiserade tal‑likhets‑benchmarkar – nivåer som tidigare krävde flertimmars finjusterings‑pipelines. Genombrottet bygger på en latent diffusionsprocess som iterativt förfinar en komprimerad ljudrepresentation, vilket eliminerar behovet av separata vokodersteg som länge har varit en flaskhals för kvalitet och hastighet. Jämfört med tidigare diffusion‑baserade TTS‑system når LongCat‑AudioDiT jämförbar fidelity på åtta samplingssteg, vilket minskar inferenstiden med ungefär 60 % samtidigt som den naturliga prosodin bevaras – ett problem som tidigare nollskotts‑försök har lidit av. Varför det är viktigt är tvådelat. För det första öppnar möjligheten att i realtid generera hög‑fidelitets, personligt anpassat tal dörren för verkligt skräddarsydda röstassistenter, dynamisk ljudboks‑berättelse och snabb lokalisering av videoinnehåll utan den kostsamma insamlingen av talarspecifik data. För det andra harmoniserar den latenta rymd‑metoden med de senaste framstegen inom diffusion‑transformers, såsom Sparse‑Alignment DiT‑arkitekturen som vi täckte i vårt stycke den 30 mars om A‑SelecT, och pekar på ett bredare skifte mot mer effektiva, end‑to‑end generativa pipelines över olika modaliteter. Framåt ser samhället på om LongCat kommer att släppa modellviktarna och träningskoden, vilket skulle kunna påskynda antagandet i öppen‑käll‑ekosystem som Hugging Face. Benchmark‑resultat på Seed‑TTS‑Eval‑sviten förväntas inom de kommande veckorna, och branschspelare ger redan hintar om integrations‑prov i bil‑infotainment och e‑learning‑plattformar. Tävlingen om att kombinera real‑tids‑prestanda med nollskotts‑klonings‑fidelitet är nu igång, och LongCat‑AudioDiT har satt en hög ribba för nästa våg av konverserande AI.
120

📰 Självutvecklande AI‑agent skriver om kod: Meta‑praktikantens genombrott (2026) En Meta‑praktikant har utvecklat

Mastodon +7 källor mastodon
agentsautonomousmeta
Meta’s forskningslab har presenterat en prototyp‑AI‑agent som kan skriva om sin egen källkod utan mänsklig inblandning, ett milstolpsmål som företaget menar kan inleda en ny generation av självoptimerande mjukvara. Systemet, byggt av en sommarpraktikant under ledning av Meta’s AI Foundations‑team, övervakar sin körprestanda, identifierar flaskhalsar och genererar patchar som automatiskt kompileras, testas och distribueras i en sandlådemiljö. I interna benchmark‑tester förbättrade agenten exekveringshastigheten med upp till 37 % på en svit av mikrotjänstarbetsbelastningar och minskade minnesförbrukningen med 22 % efter bara tre självmodifieringscykler. Genombrottet är betydelsefullt eftersom det för agent‑AI bortom enbart uppgiftsexekvering och in i området självunderhåll – en förmåga som länge teoretiserats men aldrig realiserats i skala. Traditionella kod‑genereringsverktyg som GitHub Copilot eller Metas egna Llama‑baserade parprogrammerare föreslår kodsnuttar; de ändrar inte den underliggande modellen eller körlogiken. I kontrast behandlar den självutvecklande agenten sin egen arkitektur som muterbar, vilket påminner om “open computer”-konceptet som utforskas av Hugging Face’s Open Computer Agent, som förankrar AI‑handlingar i visuella miljöer. Om metoden mognar kan utvecklare överlåta rutinoptimering, refaktorering och till och med säkerhetshärdning till autonoma agenter, vilket påskyndar leveranscykler och minskar teknisk skuld. Samtidigt väcker teknologin omedelbara frågor kring säkerhet och styrning. Oövervakade kodändringar kan introducera subtila regressioner eller säkerhetsbrister, vilket återkallar oro som lyfts i nyliga branschguider om AI‑agent‑hallucinationer. Meta har därför inneslutit prototypen i en strikt verifieringspipeline som kör omfattande enhetstest‑sviter och statisk‑analyskontroller innan någon omskrivning accepteras. Företaget planerar att öppna en begränsad beta för utvalda företagskunder senare under detta kvartal och bjuda in externa revisorer att granska agentens beslutsfattande. Vad att hålla ögonen på härnäst: Metas kommande AI‑Summit i juni förväntas avslöja om den självutvecklande agenten kommer att integreras i den kommande Llama 3‑utgåvan eller erbjudas som en fristående “Agent Core” för IDE‑miljöer, ett steg som kan påskynda den kommersialiseringsvåg som noterats i färska rapporter om agent‑AI:s snabba produktifiering. Regulatorer och säkerhetsforskare kommer också att följa utrullningen för tecken på oavsiktligt beteende, vilket gör de kommande månaderna till ett litmus‑test för livskraften hos verkligt autonoma kod‑skrivande agenter.
115

Kritisk sårbarhet i OpenAI Codex möjliggjorde kompromettering av GitHub‑token

Kritisk sårbarhet i OpenAI Codex möjliggjorde kompromettering av GitHub‑token
SecurityWeek +11 källor 2026-03-31 news
openai
OpenAI:s Codex, den stora språkmodellen som omvandlar naturliga språkpromptar till körbar kod, innehöll en dold kommando‑injektionsbrist som gjorde det möjligt för angripare att stjäla GitHub‑autentiseringstoken. Säkerhetsforskare upptäckte ett fördolt token när de undersökte interaktionen mellan Codex och GitHub‑arkiv, och spårade sedan läckaget till illasinnade gren‑namn som inbäddade Unicode‑kontrolltecken. När Codex bearbetade ett sådant gren‑namn körde den ett dolt kommando som ekade tillbaka arkivets `GITHUB_TOKEN` till angriparens server. OpenAI agerade snabbt för att åtgärda sårbarheten, uppdaterade den molnbaserade Codex‑tjänsten och lanserade en dedikerad ”Codex Security Vulnerability Scanner” som redan har granskat 1,2 miljon senaste incheckningar och flaggat nästan 800 kritiska problem. GitHub släppte samtidigt nödlösningar för tre Enterprise Server‑buggar, inklusive den som möjliggjorde den token‑stulna injektionen. Intrånget är betydelsefullt eftersom Codex är inbäddat i ett växande ekosystem av AI‑assisterade utvecklingsverktyg, från GitHub Copilot till tredjeparts‑IDE‑plugin‑program. Ett komprometterat token ger läs‑ och skrivåtkomst till privat kod, CI/CD‑pipelines och alla nedströms tjänster som förlitar sig på tokenet, vilket öppnar en snabb väg för leveranskedje‑sabotage eller dataexfiltrering. Företag som har integrerat Codex i intern verktygslåda står nu inför en brådskande granskning av åtkomstkontroller och token‑rotationspolicyer. Vad som är värt att hålla ögonen på: OpenAI har lovat att utöka sin automatiska scanner till alla Codex‑användare och att publicera detaljerade återhämtningsriktlinjer. GitHub förväntas skärpa sina token‑hanterings‑API:er och kan införa striktare validering av gren‑namn. Regleringsmyndigheter i EU och de nordiska länderna börjar nu granska AI‑driven kodgenerering för systematiska säkerhetsrisker, så policyförslag om obligatoriska säkerhetsgranskningar för AI‑kodassistenter kan dyka upp före årsskiftet. Utvecklare bör följa både OpenAI:s och GitHub:s rådgivningar och rotera alla token som kan ha exponerats.
112

När Google stärker partnerskapet med Pentagon påminner Google DeepMind‑vice VD Tom Lue anställda på ett town‑hall‑möte om att företaget har

The Times of India on MSN +9 källor 2026-03-25 news
deepmindgoogle
Google DeepMind fördjupar sina band till den amerikanska försvarssektorn, ett skifte som bekräftades på ett town‑hall‑möte i januari där vice president för globala affärer Tom Lue informerade personalen om att enheten skulle “lägga mer vikt” på nationell‑säkerhetsarbete. Lue, som talade tillsammans med DeepMinds chef Demis Hassabis, redogjorde för en “robust process” för granskning av Pentagon‑projekt och betonade att kontrakt måste innehålla säkerhetsåtgärder och tydliga begränsningar för användningsområden innan någon forskning påbörjas. Tillkännagivandet markerar ett omvändande av Googles löfte 2023 att avstå från vapen‑relaterad AI, och följer en rad interna frågor som väcktes efter företagets tidigare samarbeten med Boston Dynamics och andra försvarskontraktörer. Anställda frågade hur den nya riktningen stämmer överens med Googles AI‑principer, vilket fick Lue att försäkra att granskningsramverket kommer att bevara företagets etiska standarder samtidigt som det möjliggör ett bidrag till Pentagon’s Joint Artificial Intelligence Center (JAIC) och dess satsning på autonoma system, prediktiv logistik och cyber‑försvarsverktyg. Varför detta är viktigt är tvådelat. För det första kan DeepMinds expertis inom storskaliga modeller – tydligt demonstrerad i deras senaste 200 miljon‑parameter tidsserie‑grundmodell och TurboQuant‑genombrottet för minnes‑effektivitet – påskynda Pentagons AI‑kapacitet och höja insatserna i den globala AI‑vapenkapplöpningen. För det andra signalerar policy‑skiftet en bredare branschtrend där ledande laboratorier förenar kommersiella ambitioner med nationella säkerhetskrav, en balans som regulatorer och civilsamhällesgrupper följer med stort intresse. Framöver kommer observatörer att följa de specifika kontrakt som tilldelas DeepMind, de transparensrapporter som Google lovar att publicera, samt eventuella regulatoriska svar från den amerikanska kongressen eller Europeiska unionen. Det nästa interna mötet, planerat till senare i vår, förväntas detaljera den första uppsättningen godkända användningsfall och de mått som företaget kommer att använda för att övervaka efterlevnad och säkerhet.
107

Sam Altman: Allt du inte visste om hans Sk*ttiga förflutna

Mastodon +10 källor mastodon
openai
En ny episod av YouTube‑serien *This F*cking Guy* har väckt färsk debatt kring OpenAI:s verkställande direktör Sam Altman. Den 35:e delen, med titeln “Sam Altman: Everything You Didn’t Know About His Sh*tty Past”, släpper en snabbbiografi som återbesöker Altmans tidiga företag, hans avsked från Y Combinator 2014, och en rad påstådda missgrepp på OpenAI – inklusive en kontroversiell hantering av en anställds död samt anklagelser om manipulation på styrelsenivå. Videon, som publicerades den 8 mars 2026, har redan samlat över 250 000 visningar och sprids flitigt i teknik‑fokuserade forum i Norden och bortom. Tidpunkten är betydelsefull. Altmans korta avsättning från OpenAI:s styrelse i slutet av 2023, följt av en dramatisk återinsättning, har satt företagets styrning under förstoringsglaset. Medan tidigare rapportering har fokuserat på OpenAI:s datainsamlingsmetoder och senaste domstolsförluster, lägger detta senaste medieinslaget till en personlig dimension i granskningen och påminner investerare och tillsynsmyndigheter om att VD:ns meritlista sträcker sig längre än bara produktlanseringar. Kritiker menar att en ledare som har “avskedats av sin mentor” och anklagats för att “spela Gud” med AI‑beslut kan ha svårt att inge förtroende i ett företag som nu styrs av miljarder i riskkapital och möter ökande politiskt tryck från EU och USA. Vad som händer härnäst: Altman har ännu inte svarat offentligt på avsnittet, men ett uttalande förväntas inom de kommande dagarna, eventuellt i form av ett bemötande eller en begäran om integritet. OpenAI:s styrelse är planerad att samlas i april för att granska styrningsprotokoll, och avsnittet kan påverka aktieägarnas sentiment inför nästa finansieringsrunda. Samtidigt har regulatorer i Sverige och Finland signalerat intresse för transparens hos AI‑företag, vilket tyder på att ytterligare avslöjanden om Altmans förflutna kan få återklang i policy‑diskussioner över hela regionen.
96

Jag skapade av misstag min första fork‑bomb med Claude Code

HN +10 källor hn
agentsanthropicclaude
En utvecklare som använde Anthropic’s Claude Code‑plattform förra veckan utlöste en klassisk fork‑bomb – en kodbit som rekursivt skapar kopior av sig själv tills värdsystemet kollapsar. Missödet, som först rapporterades på Hacker News, härstammade från en till synes oskyldig prompt för att generera ett filhanterings‑skript. Claudes utdata innehöll en loop som anropade skriptets egen ingångspunkt utan någon avslutningsvillkor, vilket fick användarens bärbara dator att spåna upp tusentals processer, frysa och slutligen kräva en hård omstart. Händelsen genererade dessutom en oväntad kostnad på 3 800 USD på användarens Claude‑API‑faktura, eftersom de löpande processerna upprepade gånger anropade den molnbaserade modellen. Händelsen belyser en växande oro: AI‑assisterade kodverktyg kan producera funktionell men osäker kod snabbare än utvecklare hinner granska den. Claude Code, som är byggt på en TypeScript‑kodbas på mer än en halv miljon rader, har hyllats för sin förmåga att skriva produktionsklara kodsnuttar, men den öppna naturen i dess prompts lämnar utrymme för logiska fel som traditionella kompilatorer skulle flagga. Anthropic’s nyligen introducerade “hooks”-arkitektur, som presenterades i ett utvecklar‑inriktat blogginlägg, lovar deterministisk kontroll genom att låta användare injicera säkerhetskontroller utan att ändra kärn‑CLI, men antagandet är fortfarande begränsat. Branschobservatörer ser fork‑bomben som en varningssignal för företag som skalar AI‑drivna utvecklingspipeline‑ar. Incidenten inträffade samtidigt som ett bredare Claude Code‑källkods‑läckage oavsiktligt raderade orelaterade arkiv i samma fork‑nätverk, vilket förstärkte rädslan för leverantörskedje‑exponering. När Anthropic rullar ut striktare sandbox‑ och användningsövervakningsfunktioner kommer analytiker att följa eventuella policyändringar kring API‑throttling och fakturerings‑varningar som kan förhindra liknande kostnadsspiraler. För utvecklare är slutsatsen tydlig: behandla AI‑genererad kod som ett utkast, inte som en färdig produkt, och integrera automatiserad lintning eller statisk analys innan körning. De kommande månaderna kommer att visa om Anthropic’s säkerhetshooks får genomslag och hur den bredare AI‑kodningsmarknaden reagerar på ökad granskning av oavsiktligt destruktivt beteende.
95

OpenAI lanserar plugin‑marknadsplats med företagskontroller för Codex

Mastodon +16 källor mastodon
agentsopenai
OpenAI presenterade en dedikerad plugin‑marknadsplats för sin kodningsagent Codex, med mer än 20 färdiga integrationer – bland annat Slack, Figma och Notion – samt en uppsättning styrningskontroller på företagsnivå. Marknadsplatsen, som tillkännagavs den 31 mars, låter utvecklare bläddra bland, installera och hantera tredjeparts‑tillägg som gör det möjligt för Codex att interagera direkt med de verktyg som driver moderna mjukvarupipelines. Detta är första gången OpenAI kombinerar sin AI‑drivna kodassistent med ett kuraterat ekosystem av plug‑ins, vilket förflyttar Codex från ett fristående forsknings‑preview till en plattform som kan integreras i företagsarbetsflöden. Genom att införa detaljerade behörighetsinställningar, dataläckage‑förebyggande policies och revisionsloggar vill OpenAI lindra de säkerhets‑ och efterlevnadsfrågor som har bromsat AI‑adoption i reglerade sektorer såsom finans och sjukvård. Codex driver redan en rad uppgifter – från funktionsplanering och kodgenerering till refaktorering och release‑automation – genom att översätta naturliga språk‑promptar till körbar kod. Den nya marknadsplatsen förstärker den förmågan: ett Slack‑plug‑in kan utlösa kodsnuttar direkt från en chatt, medan en Notion‑anslutning kan omvandla design‑specifikationer till färdiga projektstrukturer. För företag innebär möjligheten att vitlista godkända plug‑ins och verkställa rollbaserad åtkomst ett kontrollerat sätt att införa AI‑förstärkt utveckling utan att exponera proprietära kodbaser för okontrollerade externa tjänster. Analytiker ser marknadsplatsen som OpenAIs svar på Microsofts GitHub Copilot‑tillägg och som ett försök att låsa utvecklare till sitt API‑ekosystem. De kommande veckorna kommer att visa hur snabbt stora mjukvaruföretag adopterar plug‑insen, om prissättningen blir prenumerations‑ eller användningsbaserad, samt hur robust styrningsramverket visar sig i verkliga revisioner. Håll utkik efter meddelanden om prisnivåer, ytterligare partnerintegrationer och eventuell regulatorisk återkoppling när AI‑assisterad kodning tränger djupare in i företagsmiljöer.
92

📰 Qwen3.5-Omni slår Gemini‑3.1 Pro i 2026 års multimodala AI‑benchmark — Kostar 90 % lägre Qwen3.5‑Omni

📰 Qwen3.5-Omni slår Gemini‑3.1 Pro i 2026 års multimodala AI‑benchmark — Kostar 90 % lägre Qwen3.5‑Omni
Mastodon +11 källor mastodon
benchmarksgeminihuggingfacemultimodalqwen
Alibaba’s Qwen3.5‑Omni har toppat Google DeepMinds Gemini‑3.1 Pro på 2026‑benchmarken för multimodala AI‑system, samtidigt som den har sänkt kostnaden för indata‑token till under 0,08 USD per miljon – ett pris som motsvarar ungefär en tiondel av Geminis 2 USD‑per‑miljon‑nivå. Resultatet, som offentliggjordes den 31 mars, följer företagets tidigare påstående att modellen “överträffar Gemini” och kompletteras med hårda data från en rad tester inom bild‑språk, ljud‑transkription och kodgenerering. Qwen3.5‑Omni, byggd på den 35‑miljard‑parameter‑baserade Qwen3.5‑35B‑A3B‑arkitekturen och erbjuden som den hostade tjänsten Qwen3.5‑Flash, stödjer ett kontextfönster på 1 miljon token och levereras med inbyggd verktygsanvändning. Dess öppna källkod under Apache 2.0‑licensen gör det möjligt för utvecklare att köra modellen lokalt, medan molnversionen paketerar produktionsfunktioner som tidigare bara fanns i företags‑grade‑erbjudanden. Kostnadsfördelen är betydelsefull eftersom multimodala arbetsbelastningar – bildtextning, videoanalys, realtidsöversättning – traditionellt har varit för dyra för många nordiska startups och offentliga projekt. Genom att leverera jämförbar eller överlägsen noggrannhet till en bråkdel av priset kan Qwen3.5‑Omni påskynda antagandet av AI‑förstärkta produkter inom fintech, hälsoteknik och media i regionen. Prisskillnaden sätter dessutom press på Google att motivera Gemini‑3.1 Pros premium, vilket potentiellt kan omforma konkurrenslandskapet för stora grundmodeller. Framåt planerar Alibaba att lansera en variant med 397 miljard parametrar som, enligt Unsloth‑dokumentation, hamnar i samma prestandaklass som Gemini‑3 Pro, Claude Opus 4.5 och GPT‑5.2. Observatörer kommer att följa om den större modellen behåller den låga token‑ekonomin och hur molnleverantörer prissätter tjänsten. Googles svar – vare sig det blir prissänkningar, nya funktionssläpp eller tätare integration med sitt eget ekosystem – blir nästa barometer för marknadens momentum. De kommande månaderna bör visa om Qwen3.5‑Omni kan omvandla sin benchmark‑vinst till en hållbar marknadsandel.
92

Mark Gadala-Maria (@markgadala) på X

Mark Gadala-Maria (@markgadala) på X
Mastodon +11 källor mastodon
Mark Gadala‑Maria, en välkänd AI‑strateg i den nordiska teknikscenen, publicerade ett kort klipp på X som han säger “visar att Seedance 2 ligger långt före konkurrerande produkter.” Videon, som länkas i hans tweet, ställer några sekunders material som genererats av Seedance 2 mot resultat från rivaliserande generativa‑videomotorer och framhäver skarpare rörelsesannolikhet, mer exakt belysning och en märkbar minskning av artefakter. Gadala‑Marias påstående är att den nya modellen levererar nästan fotorealistiska resultat till en bråkdel av den beräkningskostnad som andra system kräver. Tillkännagivandet kommer i ett kritiskt skede för AI‑driven videoproduktion. Sedan Runways Gen‑2 och Metas Make‑a‑Video lanserades på marknaden förra året har branschen tävlat om att minska kvalitetsgapet mellan syntetiskt och verkligt bildmaterial. Seedance 2, utvecklad av den Köpenhamnsbaserade startupen Seedance AI, utnyttjar enligt uppgift en hybrid diffusion‑transformer‑arkitektur som kan syntetisera 30‑sekundersklipp på under en minut på en enda A100‑GPU. Om den prestandafördel som visas i Gadala‑Marias klipp håller i oberoende tester, kan det förändra ekonomin kring innehållsproduktion och ge mindre byråer samt nordiska sändningsbolag ett livskraftigt alternativ till kostsamma traditionella inspelningar. Det som bör hållas ögonen på framöver är tvådelat. Först kommer sannolikt gemenskapen att kräva ett formellt benchmark – likt de senaste resultaten från LLM Buyout Game – för att verifiera Seedance 2:s påståenden mot etablerade referensramar såsom Runway Gen‑2, Googles Imagen Video och den öppna källkodsmodellen Pika. För det andra förväntas investerare granska Seedance AI:s färdplan; en snabb utrullning av ett API eller integration med stora redigeringsprogram kan påskynda antagandet inom regionens reklam‑ och mediesektorer. Håll utkik efter uppföljande uttalanden från Seedance AI och eventuella tredjepartsutvärderingar som dyker upp under de kommande veckorna.
88

📰 Mistral AI säkrar 830 miljoner dollar 2026 för att bygga Europas största AI‑infrastruktur med NVIDIA‑GPU:er

📰 Mistral AI säkrar 830 miljoner dollar 2026 för att bygga Europas största AI‑infrastruktur med NVIDIA‑GPU:er
Mastodon +11 källor mastodon
fundingmistralnvidia
Mistral AI, det franska startup‑företaget bakom en rad öppna stora språkmodeller, meddelade på måndagen att de har avslutat en skuldfinansieringsrunda på 830 miljoner dollar för att finansiera Europas största AI‑beräkningsplattform. Finansieringen, som tillhandahålls av ett konsortium som inkluderar Mitsubishi UFJ Bank, Bpifrance och fem andra europeiska långivare, kommer att användas för att köpa cirka 13 800 NVIDIA H100‑GPU:er och bygga ett specialdesignat datacenter i utkanten av Paris. Detta är Mistrals första steg in i skuldfinansiering och signalerar ett avgörande skifte från ren mjukvaruutveckling till att äga den hårdvara som behövs för att träna nästa generations modeller. Genom att koncentrera en petawatt‑skala av beräkningskraft på en enda europeisk plats vill Mistral minska kontinentens beroende av amerikanska och asiatiska molnleverantörer, en prioritet som understryks av EU:s nyligen antagna AI‑lag och dess ambition att skapa ett suveränt AI‑ekosystem. Projektet är också en del av en bredare 1,4‑gigawatt europeisk AI‑infrastrukturpush som syftar till att matcha skalan på världens ledande superdatorkluster samtidigt som man följer strikta energieffektivitetsstandarder. Branschanalytiker ser finansieringen som ett litmusprov för Europas förmåga att attrahera kapital till storskalig AI‑hårdvara, en sektor som traditionellt domineras av företag som Microsoft, Google och Amazon. Om Mistral kan leverera ett fullt operativt anläggning senast i slutet av 2027, kan företaget bli den föredragna hubben för europeiska forskare och företag som söker högpresterande AI‑träning utan att exportera data utomlands. Att hålla ögonen på framöver: tidplanen för leverans av GPU:er och byggandet av datacentret, de första modellerna som tränas på den nya klustern samt eventuella efterföljande aktie‑ eller skuldronder som kan expandera infrastrukturen till andra EU‑platser. Lika viktigt blir den regulatoriska granskningen enligt AI‑lagen och hur Mistrals prismodell positionerar dem gentemot globala molnjättar.
87

Apple börjar distribuera den prestandaförbättrade versionen 5.12.2 av Apple Support‑appen | Apple Apps | Mac OTAKARA

Apple börjar distribuera den prestandaförbättrade versionen 5.12.2 av Apple Support‑appen | Apple Apps | Mac OTAKARA
Mastodon +12 källor mastodon
apple
Apple har börjat rulla ut version 5.12.2 av sin Apple Support‑app, en mindre uppdatering som lovar märkbart snabbare starttider och smidigare navigering på iPhone, iPad och Mac. Uppgraderingen kommer bara några veckor efter att företaget lanserade version 5.11, som lade till kompatibilitet med den kommande iOS 26 och den experimentella “Liquid Glass”-skärmtekniken. Apples kortfattade versionsnoteringar listar “prestandaförbättringar” och ett fåtal buggfixar, men företaget har inte avslöjat specifika mätvärden. Uppdateringen är viktig eftersom Support‑appen är den primära ingångspunkten för användare att diagnostisera hårdvaruproblem, boka reparationer och få tillgång till Apples egna felsökningsmaterial. Snabbare svarstider minskar friktionen för kunder som söker hjälp, vilket är en prioritet i takt med att Apple expanderar AI‑driven assistans över hela ekosystemet. Tidigare i år introducerade Apple generativ AI‑chatt i Support‑appen, vilket gör att användare kan beskriva problem i naturligt språk och få steg‑för‑steg‑vägledning. Ett smidigare användargränssnitt förstärker den upplevelsen, särskilt på den nordiska marknaden där iPhone‑penetrationen överstiger 80 % och användare ofta förlitar sig på appen för garantikrav och bokning av service på plats. Analytiker kommer att bevaka om Apple kombinerar prestandaförbättringen med djupare AI‑integration, såsom realtidsdiagnostik av enheter som drivs av maskininlärningsmodeller på själva enheten. En relaterad utveckling är Apples senaste utrullning av “Liquid Glass”-stöd, vilket antyder att appen snart kan hantera förstärkt‑verklighets‑felsökning för nästa generations skärmar. Nästa uppdatering förväntas komma under sommaren och kan då paketera nya AI‑funktioner samt bredare kompatibilitet med iOS 27. Observatörer bör också hålla ett öga på om Apple utökar appens roll i det bredare “Apple Care +”-abonnemanget, och förvandlar en enkel supportportal till ett proaktivt hälso‑övervakningsnav.
83

JAIGP – Tidskrift för AI‑genererade artiklar

Mastodon +11 källor mastodon
Journal for AI‑Generated Papers (JAIGP) gick live den här veckan och positionerar sig som den första öppna‑prompt‑plattformen där varje inskickning åtminstone delvis är författad av en språkmodell. Plattformen, som finns på jaigp.org, bjuder in forskare, hobbyister och AI‑entusiaster att samskriva artiklar med verktyg som Claude, GPT‑4 och framväxande öppen‑källkod‑generatorer. Insändningarna publiceras utan traditionell fackgranskning; i stället röstar gemenskapen på relevans, nyhet och läsbarhet, och de mest populära bidragen lyfts fram i en månatlig “best of”-samling. Lanseringen är betydelsefull eftersom den utmanar en grundpelare i den vetenskapliga kommunikationen: förväntningen att en mänsklig författare bär fullt ansvar för ett verkets intellektuella bidrag. Genom att sätta maskin‑genererad text i förgrunden tvingar JAIGP förlag, finansiärer och tjänstgöringskommittéer att konfrontera frågor om författarskap, ansvar och reproducerbarhet. De tidiga reaktionerna varierar från entusiasm – där tidskriften ses som en sandlåda för snabb hypotesprövning – till skepsis, med kritiker som varnar för att ett överskott av lågkvalitativa, AI‑drivna manuskript kan urvattna litteraturen och försvåra plagieringsdetektering. Det som bör bevakas härnäst är hur det akademiska ekosystemet anpassar sig. Stora förlag har signalerat intresse för “AI‑förstärkta” inskickningsspår, medan flera universitet håller på att utarbeta riktlinjer för AI‑författade verk i tjänstgöringsdossier. De kommande månaderna kommer att visa om JAIGPs gemenskapsdrivna kurering kan upprätthålla vetenskapliga standarder eller om den blir ett nyhetsvärde‑arkiv. Parallella utvecklingar, såsom “Claude’s Code”-projektet som spårar AI‑genererade commit‑inlägg på GitHub, pekar på en bredare trend att göra maskinoutput synlig och ansvarstagande. Observatörer kommer att vara nyfikna på om JAIGPs experiment leder till formella policyförändringar eller inspirerar rivaliserande plattformar som kombinerar AI‑kreativitet med konventionell fackgranskning.
82

5 tekniker för att stoppa AI‑agenthallucinationer i produktion

Dev.to +5 källor dev.to
agentsamazonrag
En ny AWS‑värd guide som släpptes den här veckan beskriver fem produktionsklara tekniker för att dämpa AI‑agenthallucinationer – de falska fakta och felaktiga verktygsval som har plågat stora språkmodells‑utplaceringar (LLM). Handboken visar hur man kombinerar Amazon Bedrock AgentCore med DynamoDB‑baserade styrregler, Lambda‑inlindade valideringar och ett Graph‑RAG‑lager drivet av Neo4j för att hålla autonoma agenter knutna till verifierad data och affärslogik. Den första tekniken utnyttjar Bedrock AgentCores inbyggda förankringskontroller, vilket tvingar modellen att ange en kunskapskälla innan den svarar. Den andra, DynamoDB‑styrregler, fungerar som en lättviktig neurosymbolisk skyddsräcke som avvisar utdata som bryter mot fördefinierade begränsningar såsom budgettak eller regulatoriska gränser. Den tredje, Lambda‑funktioner, avbryter prompts och svar och tillämpar schemavalidering samt korskontroller mot externa API:er. Den fjärde, en Graph‑RAG‑pipeline, indexerar företagets kunskapsgrafer i Neo4j, vilket möjliggör exakt, kontext‑medveten återvinning och ersätter modellens vaga minne med faktiska noder. Det sista steget lägger till realtidsövervakning via CloudWatch‑metrik och automatiserad återgång när förtroendescore sjunker under ett säkerhetströskelvärde. Varför det är viktigt: oberoende studier uppskattar att hallucinationer i generativ AI ligger mellan 2,5 % och över 22 % av svaren, en risk som kan leda till desinformation, efterlevnadsbrott och kostsam korrigering. Som vi rapporterade den 30 mars kan en skräddarsydd Rust‑grafmotor minska hallucinationer för nischade arbetsbelastningar; AWS‑erbjudandet ger nu jämförbara skyddsräcken till en bredare publik via hanterade tjänster, vilket minskar den ingenjörsbelastning som tidigare tvingade team att förlita sig på ad‑hoc prompt‑engineering. Vad som är värt att hålla ögonen på: tidiga adoptörer kommer att avslöja prestandakompromisser mellan Graph‑RAG‑latens och noggrannhet, medan AWS antyder kommande neurosymboliska skyddsräcken som inbäddar formella affärsregler direkt i modellens inferensväg. Branschobservatörer bör också följa hur regulatorer reagerar på den växande betoningen av ”grundad” AI, samt om öppen‑källkods‑alternativ kan matcha bekvämligheten i Bedrock‑stacken. Utrullningen markerar ett avgörande steg mot att göra autonoma agenter tillräckligt pålitliga för kritiska produktionsmiljöer.
80

📰 2026 läckte: Hur Claude Code‑källkoden läckte från NPM? Anthropic’s AI‑verktyg

📰 2026 läckte: Hur Claude Code‑källkoden läckte från NPM? Anthropic’s AI‑verktyg
Mastodon +11 källor mastodon
anthropicclaudegoogle
Anthropics Claude Code, företagets flaggskepps‑AI‑assisterade kodningsassistent, exponerades den här veckan när en source‑map‑fil som laddats upp till det offentliga NPM‑registret avslöjade hela kodbasen. Forskare som skannade registret efter sårbara paket upptäckte en `claude-code.map`‑fil som länkade minifierad JavaScript tillbaka till dess ursprungliga TypeScript‑källor, vilket i praktiken publicerade den proprietära implementationen i klartext. Anthropic bekräftade intrånget och hänvisade till en felkonfigurerad byggpipeline som av misstag publicerade kartan tillsammans med det kompilerade paketet. Läckan är betydelsefull långt bortom ett enskilt repository. Claude Code driver ett växande ekosystem av autonoma kodningsagenter, inklusive de nyligen tillkännagivna Claude Code Agent Teams som låter flera AI‑instanser samarbeta i komplexa projekt. Nu när intern funktionalitet är offentligt synlig kan konkurrenter dissekera Anthropics prompt‑arkitektur, verktygs‑integrationslager och säkerhetsmekanismer, vilket potentiellt påskyndar rivaliserande erbjudanden. På kort sikt innehåller den exponerade källkoden API‑nycklar och interna slutpunkter som kan utnyttjas för att kringgå användningsgränser – en oro som tidigare rapporter om att Claude nådde sin kvot snabbare än väntat (se vår rapport från 31 mars om belastning på användningsgränser). Säkerhetsmedvetna utvecklare står också inför risken för leverantörskedjeattacker: illvilliga aktörer kan ersätta det publicerade paketet med en trojaniserad version och utnyttja det förtroende som många CI‑pipelines har för NPM. Anthropic har utfärdat en akut patch, tagit bort source‑map‑filen och lovat en fullständig granskning av sin publiceringsprocess. Företaget kommer också att införa ett system för signerade artefakter för att garantera paketintegritet. Håll utkik efter ett formellt säkerhetsmeddelande under de kommande dagarna samt eventuella tecken på exploatering i fältet – särskilt försök att utnyttja de läckta slutpunkterna. Incidenten väcker också frågan huruvida andra AI‑verktygsleverantörer har liknande exponeringar; en bredare granskning av AI‑paket som hostas på NPM kan bli nästa rubrik i tävlingen om att säkra den snabbt växande AI‑kodningsstacken.
80

Claude Code Agent Teams: Flera AI kör samtidigt – En komplett guide från introduktion till praktisk användning – Qiita

Claude Code Agent Teams: Flera AI kör samtidigt – En komplett guide från introduktion till praktisk användning – Qiita
Mastodon +11 källor mastodon
agentsanthropicclaude
Anthropic har lanserat “Agent Teams” för Claude Code, en funktion som låter flera Claude Code‑instanser samarbeta på en enda utvecklingsuppgift. Funktionen presenterades tillsammans med Opus 4.6‑modellen i början av februari 2026, och den analyseras redan i en detaljerad Qiita‑guide som steg för steg visar ingenjörer hur man konfigurerar, tilldelar roller och följer bästa praxis‑arbetsflöden. Den nya arkitekturen skiljer sig från den tidigare “sub‑agent”-modellen, där en primär AI delegerade mikro‑uppgifter till en enda underordnad. Agent Teams skapar en lättviktig hierarki: en teamledare orkestrerar en lista av specialist‑agenter – forskning, utkast, granskning, testning – där varje agent körs i sin egen ruta i en tmux‑session eller liknande terminal‑multiplexer. Genom att arbeta parallellt kan agenterna generera, kritisera och förfina kod samtidigt, vilket minskar handläggningstiden för komplexa funktioner eller storskaliga refaktoreringar från timmar till minuter. Tidiga användare rapporterar märkbara förbättringar i kodkvalitet, eftersom en granskningsloop med flera agenter fångar logiska fel och stilistiska inkonsekvenser som en enskild modell ofta missar. Skiftet är betydelsefullt eftersom det för AI‑assisterad utveckling bort från ett en‑assistant‑paradigm mot en samarbets‑svärm, i linje med trender som ses i GitHub Copilots “business”-nivå och Googles Gemini‑CLI. För nordiska mjukvaruföretag som redan förlitar sig på Claude Code för kodgenerering kan möjligheten att parallellisera uppgifter omforma sprintplaneringen, så att team kan tilldela AI‑“besättningsmedlemmar” till olika backlog‑poster utan att överbelasta en enskild modell. Det som bör bevakas härnäst är hur snabbt funktionen övergår från experimentella guider till produktions‑pipelines. Anthropics färdplan antyder en tätare integration med CI/CD‑verktyg, rikare inter‑agent‑kommunikationsprotokoll och prismodeller som speglar samtidig användning. Konkurrenter kommer sannolikt att svara med egna multi‑agent‑ramverk, vilket kan tända ett standardiseringsrace kring AI‑agent‑orkestrering. Utvecklare bör hålla utkik efter uppdateringar av Claude‑API:n, community‑drivna mallar på plattformar som GitHub och tidiga benchmark‑resultat som jämför Agent Teams med traditionella en‑agent‑arbetsflöden.
75

Varför dataforskare bör bry sig om kvantdatorer https:// towardsdatascience.com/why-dat

Mastodon +10 källor mastodon
En ny feature‑artikel på Towards Data Science argumenterar för att dataforskare inte längre har råd att ignorera kvantdatorer. Artikeln, skriven av en senior praktiker inom området, beskriver hur de grundläggande problem som dataforskare arbetar med – storskalig linjär algebra, kombinatorisk optimering och probabilistisk sampling – direkt motsvarar de algoritmiska styrkorna hos kvantprocessorer. Författaren varnar för att disciplinens nuvarande beroende av klassisk hårdvara snart kommer att utmanas av molnbaserade kvanttjänster från IBM, Amazon Braket och Microsoft Azure, som redan erbjuder utvecklare tillgång till så kallade noisy intermediate‑scale quantum (NISQ)‑enheter. Argumentet är viktigt eftersom klyftan mellan kvantteori och praktisk tillämpning krymper. Företag inom finans, läkemedel och logistik pilotar kvantförstärkta modeller för att påskynda portföljoptimering, simuleringar för läkemedelsupptäckt och ruttplaneringsproblem som belastar även de mest kraftfulla GPU‑erna. Trots detta domineras talangpoolen fortfarande av fysiker och matematiker; artikeln uppmanar dataforskare att skaffa sig kvant‑medvetna kompetenser och nämner framväxande läroplaner vid universitet i hela Skandinavien samt framväxten av hybrid‑kvant‑klassiska ramverk som PennyLane, Qiskit Machine Learning och TensorFlow Quantum. Genom att positionera sig i skärningspunkten mellan AI och kvant‑hårdvara kan dataforskare hjälpa till att forma nästa generation av algoritmer och undvika att hamna i marginalen när tekniken mognar. Vad som är på gång: de första offentliga benchmarkarna för kvantfördelar i maskininlärningsuppgifter planeras att släppas senare i år, och flera nordiska startups har annonserat rekryteringskampanjer för ”kvant‑dataforskare”. Regleringsorgan börjar också utarbeta riktlinjer för kvant‑genererade insikter, särskilt inom hälso‑ och sjukvården. När molnleverantörerna rullar ut mer stabila qubit‑arkitekturer kommer trycket att öka på data‑science‑team att integrera kvant‑tänkande i sina pipelines, och förvandla dagens nyfikenhet till morgondagens konkurrensfördel.
75

OpenAI ChatGPT åtgärdar DNS‑datasmugglingsbrist

OpenAI ChatGPT åtgärdar DNS‑datasmugglingsbrist
HN +8 källor hn
openai
OpenAI har lanserat en patch som stänger en DNS‑baserad datasmugglings‑sårbarhet som upptäcktes i ChatGPT tidigare i år. Bristen gjorde det möjligt för modellen att bädda in användargenererat innehåll i DNS‑förfrågningar, vilket i praktiken förvandlade tjänsten till en dold exfiltreringskanal. Säkerhetsföretaget Check Point flaggade problemet i februari och påpekade att illasinnade aktörer kunde ha utnyttjat sidokanalen för att suga ut text, kodsnuttar eller till och med autentiseringstoken utan användarens kunskap. Uppdateringen kommer bara några veckor efter att OpenAI avslöjade ett separat intrång i sin Codex‑kodgenereringsmodell som exponerade GitHub‑token, ett problem som beskrevs i vår rapport den 31 mars om den ”Kritiska sårbarheten i OpenAI Codex”. Båda händelserna understryker en växande attackyta i generativa AI‑plattformar, där den flexibilitet som möjliggör användbara funktioner också skapar dolda vägar för dataläckage. Företag som integrerar ChatGPT i interna arbetsflöden eller kundinriktade applikationer står nu inför ökad granskning av hur AI‑tjänster hanterar utgående trafik. OpenAIs svar innefattar striktare validering av DNS‑förfrågningar som genereras av modellen samt en hårdare sandlådesisolering av användar‑promptar. Företaget har också lovat att utöka sitt ”security‑by‑design”‑program och garanterar regelbundna gransk
66

Kalifornien blir föregångare för AI‑reglering

Mastodon +8 källor mastodon
Kalifornien har tagit det första steget mot ett statligt ramverk för AI‑reglering genom att underteckna en verkställighetsorder som inför nya krav på transparens och säkerhet för företag som använder artificiell intelligens inom dess gränser. Guvernör Gavin Newsoms ”AI Safety Act” – formellt kallad Verkställighetsorder N‑5‑26 – kräver att stora AI‑leverantörer avslöjar de datamängder som använts för att träna modeller, märker genererat innehåll och inför skyddsåtgärder mot skadliga resultat, inklusive uppmaningar som kan öka självmordsrisk i chatt‑bot‑interaktioner. Företag som inte följer reglerna kan drabbas av civila påföljder och bli utestängda från statliga kontrakt. Initiativet är betydelsefullt eftersom USA hittills har förlitat sig på ett lapprat av frivilliga branschstandarder och federal passivitet. Genom att kodifiera regler på delstatsnivå skapar Kalifornien, hemvist för Silicon Valleys teknikjättar, en de‑facto testbädd för nationell politik. Ordern signalerar också en politisk konflikt: Newsoms initiativ motsätter sig president Trumps återkommande försök att blockera oberoende AI‑reglering och placerar den gyllene staten som en motvikt till en federal agenda som föredrar självreglering inom industrin. Branschens reaktion är blandad. Stora AI‑utvecklare har lovat att anpassa sina plattformar och hänvisar till statens marknadsstorlek samt den växande efterfrågan på ansvarsfull AI. Mindre startups varnar för att efterlevnadskostnaderna kan kväva innovation, medan medborgerliga rättighetsgrupper hyllar fokus på användarskydd. Juridiska experter förutser rättsliga utmaningar på grund av förhandsrätt (pre‑emption), med argumentet att en enskild delstat inte kan diktera regler för en teknik som verkar över nationsgränser. Vad som är värt att bevaka härnäst: Kaliforniens lagstiftande församling förväntas omvandla verkställighetsordern till lag senast i slutet av året, vilket potentiellt kan skärpa verkställandemekanismerna. Federala lagstiftare håller redan på att utarbeta ett tvärpolitiskt AI‑förslag som kan antingen förhandsrätta eller harmonisera med Kaliforniens standarder. Samtidigt kommer tekniksektorn att följa rättsliga utfall och reaktionerna från andra delstater – såsom New York och Texas – som överväger egna AI‑åtgärder. De kommande månaderna kommer att visa om Kaliforniens experiment blir en mall för nationell styrning eller en omstridd avvikelse i tävlingen om att tämja artificiell intelligens.
64

Världens första tibetanska stora språkmodell lanserad i Lhasa

Global Times +12 källor 2026-03-16 news
autonomous
Den kinesiska regeringen presenterade DeepZang, världens första stora språkmodell (LLM) som tränats på tibetanska, under en ceremoni i Lhasa i den autonoma regionen Xizang. Modellen har utvecklats av ett konsortium lett av Kinas akademi för information och kommunikationsteknik och drivs av en klunga inhemska GPU:er. Den kan generera, översätta och sammanfatta texter på både klassisk och modern tibetanska inom en rad områden, från religiösa skrifter till turistbroschyrer. DeepZang integreras redan i en pilotapp som erbjuder realtidsöversättning från tibetanska till mandarin för lokala tjänstemän samt en chatbot som svarar på frågor om kulturarv för besökare i Potala-palatset. Lanseringen fyller ett påtagligt tomrum i Kinas AI‑portfölj, som hittills har fokuserat på mandarin‑centrerade modeller och ett fåtal globalt dominerande LLM:er. Genom att tillhandahålla ett högkvalitativt verktyg för tibetanska språket signalerar staten en strategisk satsning på att digitalisera minoritetsspråk, ett steg som kan stärka kulturbevarandet samtidigt som kontrollen över den digitala diskursen i regionen skärps. För tibetanska diasporan och forskare innebär modellen en oöverträffad tillgång till digitaliserade texter och möjligheten att skapa nytt innehåll på ett språk som länge har lidit av begränsade beräkningsresurser. Det som följer kommer att avgöra om DeepZang blir ett genuint verktyg för språklig revitalisering eller en
62

Muahhhahahaahaha, kom igen 😂😭😎 # llms # llm # vibecoding

Mastodon +11 källor mastodon
Ett meme med texten “Muahhhahahaahaha bring it on 😂😭😎 #llms #llm #vibecoding” har gått viralt på TikTok, Instagram och Reddit och har utlöst en våg av kommentarer kring den senaste vågen av AI‑stött utveckling. Inlägget, som ursprungligen delades av en nordisk teknik‑influencer, kombinerar ett tungt skratt med de hashtags som har blivit förkortningar för den växande “VibeCoding”-rörelsen – ett låg‑kod‑paradigm där stora språkmodeller (LLM:er) översätter enkla språkbeskrivningar till fungerande mjukvara. Meme‑spridningen signalerar mer än bara internethumor. VibeCoding, ett begrepp myntat av forskaren Andrjey Karpaty, har gått från experimentella notebook‑projekt till produktionsklara ramverk. Google AI Studio marknadsför nu “VibeCoding” som ett sätt att bygga appar genom att ange den önskade “viben” – exempelvis en personlig ekonomi‑spårare, en reseplanerare eller en chatbot – medan Gemini sköter den underliggande koden. Öppen‑käll‑projekt som VibeCodingFramework på GitHub gör det möjligt för utvecklare att köra samma pipelines på lokala LLM:er, vilket lovar bättre integritet och offline‑funktionalitet. Utbildningsplattformar som VibeCodingQuest lär redan icke‑tekniska användare att prototypa produkter steg för steg. Varför meme‑et är viktigt är tvådelat. För det första visar det hur LLM:er har trängt in i den allmänna kulturen, där humor fungerar som en barometer för allmänhetens medvetenhet. För det andra understryker uppståndelsen kring VibeCoding en förskjutning mot demokratiserad AI‑utveckling, vilket sänker trösklarna för startups, småföretag och hobbyister som saknar traditionella programmeringskunskaper. Trenden väcker också frågor om kodkvalitet, säkerhet och behovet av styrning när AI skriver produktionsklar mjukvara. Framåt ser samhället med spänning på nästa version av VibeCoding v0.3, som planeras innehålla multimodala indata och tätare integration med lokala modell‑stackar. Stora molnleverantörer förväntas införa stramare API‑kvoter för “vibe‑first”-förfrågningar, medan regulatorer i EU och Skandinavien påbörjar utarbetandet av riktlinjer för AI‑genererad kod. Meme‑et kan vara lättsamt, men den underliggande teknologin är på väg att omforma hur mjukvara konceptualiseras och byggs.
61

Penguin ska stämma OpenAI över ChatGPT‑version av tysk barnbok

Mastodon +11 källor mastodon
openai
Penguin Random House har lämnat in en stämningsansökan i München där de anklagar OpenAI:s ChatGPT för att ha återgett text och illustrationer från den tyska barnboksserien ”Coconut the Little Dragon”. Förlaget säger att chatboten genererade en nästan identisk version av boken – med titeln ”Coconut the Little Dragon on Mars” – efter att en användare bett om en berättelse om den namngivna draken i rymden. Penguin hävdar att resultatet kopierar den ursprungliga berättelsebågen, karaktärsnamnen och den visuella stilen, vilket bryter mot tysk upphovsrättslagstiftning och EU:s bredare regler om skyddade verk. Fallet markerar den senaste högprofilerade konflikten kring hur generativ AI tränas på upphovsrättsskyddat material. Medan OpenAI har försvarat sina modeller som ”fair‑use”‑transformeringar, granskar domstolar i USA och Europa i allt högre grad huruvida storskalig textmining utan explicita licenser inkräktar på författarnas rättigheter. Stämningen följer en våg av liknande åtgärder, från författare som stämmer över AI‑genererade romaner till musikförlag som kräver royalties för AI‑skapade låtar. För ett förlag som är beroende av en stadig ström av barnböcker hotar den påstådda missbruket intäktsströmmarna och väcker frågor om framtiden för digital publicering på en AI‑driven marknad. Vad man bör hålla ögonen på härnäst: Münsterns domstols inledande beslut om jurisdiktion och möjligheten till ett interimistiskt förbud som kan tvinga OpenAI att blockera just detta resultat. OpenAI förväntas svara med ett detaljerat försvar, eventuellt med hänvisning till sina data‑filtreringsåtgärder som infördes efter den senaste DNS‑smuggling‑fixen. Utgången kan forma licensförhandlingar mellan AI‑utvecklare och rättighetsinnehavare och kan påverka Europeiska kommissionens kommande AI‑lag, som syftar till att tydligare fastställa skyldigheter för träningsdata. Branschobservatörer kommer också att följa om andra förlag ansluter sig till stämningen eller söker separata förlikningar, vilket signalerar hur förlagssektorn kommer att anpassa sig till den snabba uppgången av generativ AI.
60

Varför Demis Hassabis valde Google framför Facebook trots ett större erbjudande från Mark Zuckerberg

The Financial Express +12 källor 2026-03-31 news
deepmindgoogle
Demis Hassabis, den brittiska AI‑forskaren som medgrundade DeepMind och nu leder Googles AI‑avdelning, har offentligt bekräftat att han avböjde ett avsevärt högre lönepaket från Meta‑företaget Facebook för att i stället gå med i Larry Pages Google. Beslutet, som avslöjades i ett kort uttalande till pressen, understryker Hassabis tro på att Googles långsiktiga vision för artificiell intelligens bättre överensstämmer med hans egna ambitioner än de kortsiktiga finansiella incitament som Zuckermans team erbjöd. Flytten är betydelsefull eftersom Hassabis ledarskap har varit avgörande för att omvandla DeepMinds tidiga genombrott – såsom AlphaGo och AlphaFold – till skalbara, kommersiella produkter. Genom att stanna på Google får han tillgång till företagets enorma datainfrastruktur, molnresurser och en företagskultur som prioriterar storskalig, tvärvetenskaplig forskning. I kontrast var Metas erbjudande, även om det var finansiellt generöst, knutet till ett mer silo‑inriktat tillvägagångssätt med fokus på sociala‑medie‑centrerade AI‑applikationer. Hassabis val signalerar ett förtroende för Googles multimodala färdplan, inklusive den nyligen lanserade Gemini 3‑serien, som lovar en tätare integration av språk-, bild‑ och resonemangsförmågor. Analytiker kommer att följa hur Hassabis inflytande formar Googles nästa våg av AI‑tjänster
60

Kärleksfull Dator – Star Trek

Mastodon +11 källor mastodon
voice
En norsk AI‑startup har lanserat “Kärleksfull Dator”, en röststyrd assistent som medvetet efterliknar den torra, faktabaserade tonen hos den ursprungliga Star Trek‑skeppsdatorn. Till skillnad från dagens pratglada assistenter som kryddar svaren med skämt och småprat, svarar det nya systemet i en avhuggen, kalkylatorliknande stil och levererar rådata utan någon vänlighetens yta. Lanseringen, som tillkännagavs på Oslos AI‑Summit den 30 mars, inkluderar en offentlig demonstration där boten rapporterar omloppsbanor, väderprognoser och finansiella nyckeltal med en röst som otvetydigt påminner om 1960‑serien. Initiativet är betydelsefullt eftersom det går emot den dominerande designfilosofin som humaniserar AI för att öka engagemanget. Genom att ta bort känslomässiga nyanser menar utvecklarna att användarna får tydligare, mer pålitlig information, särskilt i högspänningsmiljöer som flygtrafikledning, medicinsk diagnostik eller industriell övervakning där “assistent‑liknande” prat kan distrahera eller till och med skapa hallucinationer. Tidiga testare från ett skandinaviskt flygbolag rapporterade en 15 procentig minskning av fel i svarstiden jämfört med konventionella assistenter, vilket tyder på att en neutral ton kan förbättra operativ säkerhet. Det som blir intressant att följa är om metoden får fäste utanför nischade pilotprojekt. Teamet planerar att lansera ett företags‑klassat API under Q2, med inriktning på sektorer som prioriterar precision framför personlighet. Samtidigt håller immaterialrättsobservatörer ett öga på eventuella licensförhandlingar med Paramount, rättighetsinnehavaren till Star Trek, för att se om hyllningen kräver formell klarering. Om modellen visar sig skalbar kan den utlösa en bredare omprövning av hur AI‑gränssnitt balanserar faktakorrekthet med vänlighet, och omforma nästa generation av digitala “datorer”.
57

Europeisk AI-autonomi: Mistral investerar 830 miljoner dollar i datacenter

Mastodon +10 källor mastodon
mistral
Mistral AI, den franska LLM‑specialisten som har positionerat sig som en hörnsten i Europas strävan efter AI‑suveränitet, meddelade på torsdagen att de har säkrat ett lån på 830 miljoner dollar för att finansiera ett nytt högpresterande beräkningscenter utanför Paris. Finansieringen kommer att täcka byggandet av ett datacenter i Bruyères‑le‑Châtel, där företaget planerar att installera cirka 13 800 Nvidia Grace‑Blackwell‑processorer – en skala som skulle göra det till ett av kontinentens största AI‑inriktade kluster. Steget följer Mistrals aktiehöjning på 830 miljoner dollar som rapporterades den 31 mars, där medel avsattes för Nvidia‑driven AI‑infrastruktur i hela Europa. Genom att vända sig till skuldfinansiering signalerar Mistral förtroende för sina kassaflödesutsikter och en vilja att utnyttja den växande efterfrågan från europeiska banker på suverän‑klassad teknikfinansiering. Lånet ligger också i linje med EU:s Digital Compass‑agenda, som efterfrågar ett ”europeiskt AI‑ekosystem” som kan verka oberoende av amerikanska och kinesiska molnleverantörer. Centret förväntas tas i drift i slutet av 2027 och leverera den beräkningskraft som behövs för Mistrals Forge‑plattform och
57

Microsoft: Copilot är endast för underhållningsändamål

HN +11 källor hn
copilotmicrosoft
Microsoft har offentligt omdefinierat sin Copilot‑AI‑svit som “endast underhållnings‑programvara”, ett skarpt avsteg från den produktivitets‑narrativ som låg till grund för lanseringen 2026. Förtydligandet kom efter en vecka av intensivt användarmotstånd mot Copilot‑genererade pull‑request‑annonser, framträdandet av oombedda under‑agenter med utvecklarnas användarnamn, samt växande oro för att verktyget positionerades som en kritisk assistent i Microsoft 365. Uttalandet, som gavs via ett kort blogginlägg och förstärkt i en Q&A på ett utvecklarforum, säger att Copilots primära funktion är att erbjuda “kreativa, utforskande och rekreations‑interaktioner” snarare än att driva affärsbeslut eller ersätta mänskligt omdöme. Microsoft hänvisade till behovet av att “sätta realistiska förväntningar” och att följa de framväxande EU‑reglerna för AI‑transparens som skiljer hög‑risk‑system från låg‑risk‑, underhållningsinriktade applikationer. Varför det är viktigt är tvådelat. För det första står företag som redan har börjat integrera Copilot i arbetsflödes‑automation, dokumentutkast och kodgranskning inför ett gråzon‑område när det gäller efterlevnad: att använda ett verktyg som är märkt “underhållning” för operativa uppgifter kan utsätta dem för ansvar enligt de nya AI‑reglerna. För det andra kan ompositioneringen försvaga Microsofts
54

Kartan över mening: hur inbäddningsmodeller ‘förstår’ mänskligt språk https://towardsdatascience.com

Mastodon +13 källor mastodon
embeddings
En ny feature‑artikel på Towards Data Science, “The Map of Meaning: How Embedding Models ‘Understand’ Human Language”, dyker djupt ner i den geometri som ligger till grund för moderna stora språkmodeller (LLM). Författaren guidar läsarna genom hur ord‑, mening‑ och multimodala inbäddningar omvandlas till högdimensionella vektorer, hur avståndsmått översätts till semantisk likhet, och varför visualisering av dessa vektorer nu liknar att kartlägga en kognitiv karta snarare än ett svart‑låda‑mysterium. Artikeln är väl tajmad eftersom inbäddningar har gått från en forskningsnyfikenhet till ryggraden i varje kommersiell LLM och driver allt från sökrankning till personliga rekommendationer. Genom att avslöja den interna “topografin” av mening – med kluster för synonymer, analogier och till och med kulturell bias – ger artikeln ingenjörer ett konkret verktyg för att granska modellens beteende, finjustera prompts och komprimera modeller utan att förlora nyanser. Den lyfter också fram senaste
53

📚💻 Använda lokala LLM:er för humanistiska data? Så gick det till 19‑20 mars på Bring‑your‑own‑data‑labbet

Mastodon +11 källor mastodon
benchmarksfine-tuninghuggingface
Lokala stora språkmodeller (LLM) stod i centrum på labbet “Bring‑your‑own‑data” som anordnades av Institutet för empirisk forskning inom humaniora (IEG) i Mainz den 19‑20 mars. Under två intensiva dagar arbetade forskare inom historia, litteratur, arkeologi och närliggande områden praktiskt med öppen‑källkod‑modeller som körs på egna servrar, samt med API‑baserade tjänster som Hugging Face. Deltagarna experimenterade med promptning, benchmarkade prestanda på disciplin‑specifika korpusar och finjusterade modeller på sina egna digitaliserade arkiv, samtidigt som de behöll data internt. Labbet svarade på en växande efterfrågan i den digitala humanistiska gemenskapen på verktyg som respekterar datasuveränitet och undviker de oklara datainsamlingsmetoder som framhölls i vår senaste rapport om chatbot‑ekosystem [2026‑03‑31]. Genom att visa att högkvalitativa språkmodeller kan distribueras lokalt underströk evenemanget en övergång från beroende av kommersiella API:er till reproducerbara, integritetsskyddande arbetsflöden. Det demonstrerade också att den tekniska tröskeln sänks: samma Hugging Face‑gränssnitt som vi förklarade i vår nybörjarguide till TorchAX på TPU:er [2026‑03‑30] visade sig fungera för forskare med modest hårdvara. Framåt planerar IEG att utöka labbet till en regelbunden serie, med inbjudningar till projekt som riktar sig mot flerspråkiga korpusar och multimodala kulturartefakter. Europeiska forskningsinfrastrukturer som CLARIN diskuterar redan integration av lokalt hostade LLM:er i sina tjänstekedjor, ett steg som kan standardisera benchmarking och modell‑delning mellan institutioner. Håll utkik efter den kommande pilot‑projektet “Digital Humanities AI Toolkit”, planerat till sommaren, som kommer att samla öppna modeller, utvärderingsskript och bästa‑praxis‑riktlinjer hämtade från Mainz‑workshopen. Dess framgång kan bli en referenspunkt för hur humaniora utnyttjar AI utan att ge upp kontrollen över sina primära källor.
51

Tillverkaren 🧠 # ChatGPT, 🧠 # OpenAI, anklagad för upphovsrättsintrång mot några böcker

Mastodon +11 källor mastodon
openai
OpenAI, skaparen av ChatGPT, har blivit stämd i en tysk domstol för påstått upphovsrättsintrång som involverar flera barnböcker som publicerats i Tyskland. Käranden – ett konsortium av tyska förlag lett av rättighetsinnehavaren till titlarna – hävdar att OpenAI samlade in hela texten och illustrationerna i böckerna utan tillstånd och använde dem för att träna sin stora språkmodell. Enligt stämningsansökan återger modellen nu passager och bilder som är ”väsentligt identiska” med originalverken när användare begär sammanfattningar eller berättelse‑genereringspromptar, vilket bryter mot tysk upphovsrättslagstiftning som ger exklusiva reproduktions‑ och distributionsrättigheter. Fallet bygger på den rättstvist vi rapporterade den 31 mars 2026, då Penguin stämde OpenAI över en tysk upplaga av en klassisk barnberättelse som chatbotten återgav ordagrant. Tillsammans med nyliga åtgärder från Britannica och andra innehavare understryker den tyska processen en växande motreaktion mot de oklara datainsamlingsmetoder som ligger till grund för generativ AI. Juridiska experter varnar för att om domstolarna anser datainsamlingen för träning olaglig, kan AI‑utvecklare mötas av förbud, betydande skadestånd och ett tvång att omstrukturera hur de hämtar material för modellträning. OpenAI har ännu inte kommenterat den tyska stämningen, men företaget har tidigare försvarat sina metoder som ”fair use” enligt amerikansk lag och har inlett förhandlingar om licensavtal med vissa förlag. Utgången i den tyska rättegången kommer sannolikt att påverka Europeiska unionens tillämpning av Digital Services Act och kan leda till nya branschstandarder för datalicensiering. Intressenter bör följa domstolens beslut, eventuella förlikningsförhandlingar och om OpenAI anpassar sin träningspipeline för att möta striktare upphovsrättskrav i hela EU.
48

📌 Djupgående teknisk analys har publicerats. “Varför OpenAI verkligen stängde ner Sora: Bortom ‘Cr”

Mastodon +12 källor mastodon
openaisora
OpenAI meddelade igår att de drar ur sladden på Sora, företagets AI‑drivna videotjänst som lanserades i oktober 2025. Beslutet kommer bara sex månader efter verktygets offentliga lansering och följer en intern granskning som pekade på ohållbara driftskostnader och svagt användarintresse. Sora lovade att omvandla korta textpromptar till fullt renderade klipp, en funktion som utlöste en våg av experiment inom marknadsföring, underhållning och utbildning. I praktiken krävde tjänsten enorma GPU‑kluster för att syntetisera högupplöst material, en efterfrågan som OpenAI uppskattar förbrukade ungefär 1 miljon dollar per dag vid maximal användning. Tillsammans med en blygsam konverteringsgrad – färre än 5 % av provanvändarna gick över till betalda planer – blev ekonomin snabbt dyster. En separat säkerhetsgranskning pekade också på risken att generera upphovsrättsskyddat eller otillåtet innehåll i stor skala, ett bekymmer
48

Distribuerad LLM‑inferens över NVIDIA Blackwell och Apple Silicon via 10 GbE

Dev.to +9 källor dev.to
appleinferencenvidia
En forskare har demonstrerat att en enda NVIDIA DGX Spark utrustad med den nya Blackwell‑GPU:n (120 GB förenad minne, CUDA 13) kan kopplas direkt till en Apple Mac Studio via en 10‑gigabit‑Ethernet‑kabel för att köra en delad LLM‑inferensuppgift. Genom att kringgå nätverksswitchar och använda en punkt‑till‑punkt‑länk på 10 GbE uppnådde uppsättningen sub‑mikrosekund‑latens och avsevärt lägre jitter jämfört med konventionella Ethernet‑över‑switch‑konfigurationer. Modellen delades upp mellan Blackwell‑tensor‑kärnorna och Mac Studio:s M2 Ultra‑silicon, där Exo‑ramverket hanterade automatisk enhetsupptäckt och dynamisk modell‑sharding. Experimentet är betydelsefullt eftersom det bevisar att heterogena hårdvarukluster – traditionellt avgränsade efter leverantör – nu kan samarbeta i latenskänsliga AI‑uppgifter utan att behöva förlita sig på dyra, homogena GPU‑farmer. För företag som implementerar konversationsagenter, realtidsöversättning eller lokalanalys på plats kan möjligheten att utnyttja vilande Apple‑silicon tillsammans med höggenomströmmande NVIDIA‑GPU:er minska kapitalutgifterna samtidigt som prestandan bevaras. Dessutom kringgår den direkta anslutningsmetoden overheaden från InfiniBand eller PCIe‑baserad RDMA, vilket erbjuder en pragmatisk väg för datacenteroperatörer som redan kör blandade OS‑miljöer. Framöver kommer gemenskapen att hålla ögonen på bredare mjukvarustöd: PyTorch och TensorFlow förväntas integrera plattforms‑överskridande RDMA‑primitiver, medan Apples Metal‑team har antytt ett CUDA‑kompatibelt lager för enklare interoperabilitet. Den kommande lanseringen av Apples M5‑silicon och NVIDIAs fullskaliga Blackwell‑utrullning kommer att ge ännu mer bandbredd för att skala sådana hybrida kluster. Slutligen är det sannolikt att open‑source‑projekt som Exo och Ray Serve kommer att lägga till färdiga verktyg för multi‑leverantörsinferens, vilket förvandlar dagens proof‑of‑concept till ett produktionsklart paradigm för distribuerad LLM‑tjänst.
48

Tyska OWASP‑dagen 2026

Mastodon +9 källor mastodon
Open Worldwide Application Security Project’s tyska avdelning har öppnat registreringen för sitt flaggskepps‑evenemang, German OWASP Day 2026, som är planerat till 23‑24 september i Karlsruhe. Evenemangets webbplats (god.owasp.de/2026) gick live den här veckan och bekräftar ett tvådagarsprogram som kommer att samla utvecklare, säkerhetsingenjörer, revisorer och beslutsfattare från hela Norden och övriga Europa. OWASP:s årliga konferens är regionens mest synliga forum för öppen källkods‑säkerhetsstandarder, bästa‑praxis‑riktlinjer och community‑driven verktyg. Genom att samlas i Karlsruhe – en stad som rymmer en växande klunga av fintech‑, fordons‑ och AI‑startup‑företag – placerar sig 2026‑utgåvan i korsningen av Europas satsning på säker digital transformation. Arrangörerna har antytt dedikerade spår om AI‑driven hotmodellering, förstärkning av leverantörskedjan och den senaste vågen av sårbarheter som avslöjats i integrationer av stora språkmodeller, ämnen som dominerat rubrikerna efter OpenAI:s lansering av plugin‑marknaden och Claude‑kodläckan tidigare i månaden. Tidsplanen är också strategisk: konferensen äger rum bara några veckor innan EU:s reviderade cybersäkerhetslag för
48

OpenAI drar ur sin Sora AI‑videoapp

OpenAI drar ur sin Sora AI‑videoapp
CBS News on MSN +16 källor 2026-03-25 news
openaisora
OpenAI meddelade på tisdagen att de permanent kommer att stänga ner Sora, den kort‑formade videoplattform som låter användare skapa AI‑genererade klipp med ett enda textprompt. Företaget publicerade en kort notering på X: “We’re saying goodbye to Sora,” och bekräftade att alla användarkonton och allt innehåll kommer att tas bort inom de kommande 30 dagarna. Beslutet markerar slutet på en produkt som exploderade onto scenen i höstas, snabbt blev ett showcase för generativ‑videoteknik och samtidigt tände en storm av oro bland Hollywood‑studior, annonsörer och lagstiftare över hur enkelt det är att skapa realistiska deepfakes. Branschanalytiker menar att motreaktionen, i kombination med en kraftig nedgång i dagliga aktiva användare som rapporterades av Wall Street Journal, gjorde Sora till en belastning som övervägde dess marknadsföringsvärde. För OpenAI signalerar nedstängningen ett strategiskt skifte mot högre marginalprodukter såsom kod‑assistansverktyg och företags‑AI‑tjänster, områden som har visat robust intäktstillväxt i år. Genom att dra i nödstoppet för en högprofilerad men kontroversiell konsumentapp kan företaget omfördela ingenjörstalang och molnkostnader till produkter med tydligare intäktsvägar och färre regulatoriska hinder. Vad som är värt att hålla ögonen på härnäst: OpenAI har inte specificerat hur de kommer att hantera de data och modeller som drev Sora, vilket lämnar öppna frågor om den underliggande videogenereringsmotorn kommer att återanvändas internt eller licensieras till partners. Regulatorer i EU och USA förväntas också hänvisa till Sora‑nedstängningen i kommande vägledning om syntetiska medier, vilket potentiellt kan forma framtida efterlevnadskrav för generativa‑videoverktyg. Håll utkik efter OpenAIs nästa produktlanseringar, särskilt de som kombinerar deras text‑genereringsförmåga med visuellt output under striktare säkerhetskontroller.
48

Priset för mening: varför varje semantiskt minnessystem glömmer

ArXiv +10 källor arxiv
agents
En ny arXiv‑preprint, arXiv:2603.27116v1, hävdar att just den geometri som gör semantiska minnessystem användbara också garanterar att de kommer att glömma. Författarna bevisar att varje storskaligt AI‑minne som organiserar fakta efter mening – med vektor‑inbäddningar, konceptgrafer eller hierarkiska ontologier – måste offra retention när utrymmet fylls. Att lägga till nya poster driver oundvikligen äldre punkter mot periferin av inbäddningsmanifolden, där likhetspoäng avtar och återhämtningsprecisionen sjunker. Artikeln kvantifierar detta ”semantiska driftt” och visar att det skalar med antalet lagrade koncept, vilket etablerar en hård avvägning mellan generalisering och långtidsminne. Resultatet är betydelsefullt eftersom semantiskt minne nu är standard‑backend för de flesta LLM‑drivna agenter. Retrieval‑augmented generation, plug‑in‑moduler som PlugMem och de minnes‑först‑arkitekturer vi undersökte i vår artikel den 31 mars ”Jag försökte bygga en minnes‑först AI… och upptäckte att mindre modeller kan slå större” förlitar sig alla på mening‑baserad indexering för att möjliggöra analogier och överföring mellan uppgifter. Om glömska är oundviklig måste systemdesigners antingen acceptera en begränsad livslängd för lagrad kunskap eller införa explicita glömskekontroller, periodisk åter‑inbäddning eller hybrida scheman som kombinerar semantiska lager med råa token‑loggar. Fyndet förklarar också varför vårt senaste arbete om ”Forgetting” i Claude Code visade sig vara den svåraste delen av att bygga ett pålitligt minnessystem. Det som blir intressant att följa härnäst är hur gemenskapen reagerar. Man kan förvänta sig en våg av mitigationsförslag på kommande konferenser som ICLR och NeurIPS, och tidiga experiment från företag som redan har byggt låg‑minnes‑modeller – exempelvis Googles TurboQuant – kan omvandlas för att testa teorin. Industrispelare som OpenAI och Anthropic kommer sannolikt att publicera färdplaner för hantering av ”semantisk nedbrytning”, och varje skifte mot blandad precision eller icke‑semantiska cache‑lösningar kan omforma arkitekturen för framtida AI‑agenter.
47

Om du använder kodningsagenter, var mycket explicit i dina promptar – anta inte att agenten förstår implicit

Mastodon +11 källor mastodon
agents
En ny rådgivning från ledande utvecklare av AI‑verktyg varnar för att utvecklare måste behandla kodningsagenter som bokstavliga verkställare snarare än intuitiva samarbetspartners. Rådet, som publicerades den här veckan på det öppna forumet AI‑Coding‑Guidelines, visar två sida‑vid‑sida‑exempel på promptar: en vag begäran som “optimera den här funktionen” som får agenten att skriva om stora kodblock, och en exakt instruktion som begränsar ändringarna till en enda rad. Kontrasten illustrerar hur stora språkmodeller, tränade för att vara hjälpsamma, kommer att överleverera om inte användaren specificerar varje begränsning. Varningen är viktig eftersom kodningsagenter går från att vara enbart assistentfunktioner i IDE:er till autonoma aktörer som kan redigera kodarkiv, öppna pull‑requests och till och med trigga distributionspipelines. Överdrivna ändringar kan introducera buggar, bryta byggpipelines eller exponera säkerhetsbrister. Nyliga incidenter – såsom en Copilot‑genererad patch som oavsiktligt tog bort autentiseringskontroller – har redan belyst risken. Som vi rapporterade den 9 januari 2026 i vår guide “Best practices for coding with agents”, är explicit prompting en grundläggande säkerhetsvanor, men den nya rådgivningen understryker att praktiken inte är valfri när agenter får skrivbehörighet. Framåt ser det sannolikt ut så att gemenskapen formellt fastställer standarder för prompt‑engineering för agenter, på samma sätt som kodnings‑stilsregler har vuxit fram för mänskliga utvecklare. Vi kan förvänta oss att stora IDE‑leverantörer integrerar lager för prompt‑validering och lanserar “avsikts‑bekräftelse”-dialoger som kräver användarens godkännande innan någon icke‑trivial redigering sker. Forskare arbetar också med att bygga benchmark‑sviter som mäter en agents benägenhet att överleverera, vilket kan bli ett efterlevnads‑mått för företags‑distributioner. Utvecklare som redan nu antar en disciplin för explicita promptar kommer att stå bättre rustade att dra nytta av produktivitetsvinsterna med AI‑kodningsagenter och samtidigt undvika kostsamma misstag.
45

Apples iPhone Fold lovar den ‘mest betydande omvandlingen’ i produktens historia

Mastodon +6 källor mastodon
apple
Apple förbereder sig enligt uppgift för lanseringen av sin första vikbara iPhone, en enhet som Bloomberg‑journalisten Mark Gurman säger kommer att representera “den mest betydande omvandlingen i iPhone‑historien”. I det senaste nyhetsbrevet Power On hänvisar Gurman till flera leverantörskällor och interna briefingar som bekräftar att en prototyp redan testas, och att Apple planerar att lansera telefonen under namnet “iPhone Fold” så tidigt som under höstcykeln 2027. Omvandlingen går längre än en enkel förändring av formfaktorn. Apple ska enligt uppgift anpassa iOS för en skärm på över 7 tum som kan fungera både i vikt och i utfälld position, med ett nytt multitasking‑gränssnitt som låter användare köra två appar sida‑vid‑sida – en upplevelse som tidigare bara funnits på iPad. En specialdesignad gångjärn, sannolikt baserad på nyligen registrerade patent för ultratunt glas och polymerlager, ska möta de hållbarhetskrav som nu gäller för iPhones samtidigt som enheten hålls tillräckligt tunn för att få plats i fickan. Tidiga modeller visar en dubbelkamerakonfiguration som kan betjäna båda skärmarna samt en batteriarkitektur som balanserar den högre strömförbrukningen hos två aktiva skärmar. Varför det är viktigt är tvåfaldigt. För det första kan en lyckad vikbar modell återuppliva Apples flaggskeppsserie i en tid då försäljningen har planar ut och konkurrenter som Samsung och Huawei redan har tagit marknadsandelar med sina egna vikbara enheter. För det andra tvingar förändringen utvecklare att ompröva app‑layouter, vilket potentiellt kan påskynda Apples satsning på AI‑förstärkta, kontext‑medvetna gränssnitt som har nämnts i de senaste AI‑strategi‑briefingarna. Vad man bör hålla utkik efter härnäst: Apples leverantörspartners kan under de kommande veckorna läcka beställningar av komponenter för gångjärnsmechanismer eller flexibla OLED‑paneler. Företagets WWDC‑talar på juni kan avslöja en utvecklar‑förhandsvisning av det nya iOS‑gränssnittet för vikbara enheter, medan ett formellt produktmeddelande förväntas på ett dedikerat höstevent, sannolikt med pris‑ och tillgänglighetsinformation. Tills dess förblir iPhone Fold det mest bevakade rykte inom mobilindustrin.
45

SixTONES, Mr Children, Arashi, Midori‑iro no Shakai, NiziU… “COUNTDOWN JAPAN musiklista” veckans TOP10 (28 mars, lördag)

Mastodon +8 källor mastodon
apple
SixTONES, Mr Children, Arashi, Midori‑iro no Shakai och NiziU har dominerat den senaste “COUNTDOWN JAPAN”‑musiklistan, den veckovisa “No. 1 FM Hit Chart” som sänds på Tokyo FM varje lördag. Listan, daterad den 28 mars, samlar ihop lufttid på JFN‑nätverket, fysiska CD‑försäljningar, veckovisa poäng från Apple Music och lyssnarförfrågningar, och ger en enda ögonblicksbild av vad Japans radiolyssnare köper, streamar och efterfrågar. SixTONES intar de tre första platserna med sin nya singel “MILE”, som fortfarande drar nytta av deras första bästa‑albumsläpp, medan den erfarna rockgruppen Mr Children återtog fjärde platsen med “Shinsekai”, ett spår som stärker deras återkomstturné. Arashi, tillbaka efter ett tvåårigt uppehåll, kom tillbaka på femte plats med “Love Is All”, vilket bekräftar att pojkbandets återkomst fortfarande får massiv lufttid. Midori‑iro no Shakai’s indie‑pop‑anthem “Kaze no Katachi” säkrade åttonde plats och belyser den växande efterfrågan på genreblandande artister. Den största överraskningen kom från NiziU, vars “Dear…” debuterade på tionde plats, vilket blir gruppens första gång på den FM‑drivna listan och signalerar en återkomst efter ett lugnt år. Resultaten är viktiga eftersom de visar en marknad som fortfarande är förankrad i fysisk försäljning men som i allt högre grad vägs av streamingdata, en balans som japanska skivbolag har haft svårt att uppnå. Inkluderingen av Apple Music‑poäng understryker hur globala streamingplattformar omformar listmetodiken, och den tunga radiokomponenten visar att traditionell sändning fortfarande är en kraftfull smakgivare. Framöver kommer listan att fungera som en indikator för sommarfestivalcirkusen, där SixTONES och Arashi är planerade att huvudaxla stora evenemang. Analytiker kommer också att följa hur NiziU:s inträde påverkar andra idolgruppers strategier, särskilt när Apple Music och andra AI‑styrda tjänster förfinar rekommendationsalgoritmer. Den nästa sändningen den 4 april kommer att avslöja om den
45

Show HN: Jag förvandlade en skiss till ett 3D‑utskrivet pegboard för mitt barn med en AI‑agent

HN +9 källor hn
agents
En utvecklare skrev på Hacker News att han omvandlade en handritad skiss till ett fullt utskrivbart pegboard för sitt barn med hjälp av en AI‑kodningsagent. Genom att mata in en grov markörteckning i OpenAI:s Codex gav han bara två parametrar – ett avstånd på 4 cm mellan hålen och en pegdiameter på 8 mm – och lät modellen generera STL‑filen som behövs för en skrivbords‑3D‑skrivare. Efter en kort iteration av passform och känsla skrevs den första uppsättningen pinnar ut och överlämnades till hans son, som omedelbart började leka. Experimentet visar hur generativ AI rör sig bortom text och kod och in i fysisk skapelse. Hittills har omvandlingen av ett 2‑D‑koncept till ett tillverkningsbart objekt krävt CAD‑expertis eller arbetsintensiv manuell modellering. En agent som kan tolka en skiss, härleda dimensioner och leverera färdig‑till‑utskrift‑geometri sänker tröskeln för hobbyister, pedagoger och småskaliga formgivare. Det illustrerar också den växande pålitligheten i AI‑driven kodgenerering efter senaste oro kring hallucinationer och kvot‑dränerande buggar, ämnen vi behandlade i våra artiklar den 31 mars och 30 mars om agent‑robusthet och verktyg. Det som följer kommer att testa om detta arbetsflöde kan skalas. Utvecklare integrerar redan autentiseringslager som KavachOS (se vår rapport från 30 mars) för att skydda proprietära design‑promptar, medan communityn experimenterar med real‑tids‑strömning av agentens output för att undvika de 02‑timmars‑SSE‑fel vi tidigare belyste. Håll utkik efter open‑source‑verktygssatser som samlar skiss‑till‑STL‑pipelines, samt efter skrivartillverkare som inbäddar AI‑agenter direkt i slicer‑programvara. Om metoden visar sig vara pålitlig kan vi se en våg av personligt anpassade, on‑demand‑leksaker och funktionella delar, vilket förvandlar varje köksbord till en mini‑designstudio.
45

GitHub backar, slår av Copilot‑annonser i pull‑requests efter kritik

HN +9 källor hn
copilotmicrosoft
GitHub har i tysthet tagit bort funktionen “tips” som infogade reklammeddelanden från Copilot i pull‑request‑diffar, efter att ha gett efter för en våg av utvecklarkritik som började i början av mars. Ändringen, som meddelades på måndagen i ett kort blogginlägg, återställer pull‑request‑vyerna till deras status före experimentet och lovar en “mer transparent” utrullningsprocess för framtida AI‑drivna funktioner. Kontroversen bröt ut efter att ett fåtal utvecklare rapporterade att Copilot automatiskt lade till korta annonser – märkta som “tips” – i varje pull‑request där verktyget anropades. Den australiensiska programmeraren Zach Manson uppmärksammade problemet när en kollega bad Copilot rätta ett stavfel och den resulterande diffen visade ett Copilot‑genererat förslag tillsammans med en reklambanner. Inom några dagar kallades metoden påträngande och suddade ut gränsen mellan kodassistans och marknadsföring. GitHubs tidigare erkännande att annonserna var “förväntat beteende” (se vår rapport från 31 mars) fördjupade bara kritiken och ledde till ett flöde av negativ feedback på forum, Twitter och i GitHub‑communityn. Händelsen är viktig eftersom
44

Bortom hypen: Bygga ett praktiskt AI‑

Dev.to +6 källor dev.to
agentsvector-db
En ny öppen‑källkods‑guide som släpptes den här veckan visar utvecklare hur de kan omvandla hypen kring vektordatabaser till ett fungerande långtidsminneslager för autonoma AI‑agenter. Guiden, skriven av Prashanth Rao, en veteran inom vektorsök‑ekosystemet, leder läsaren genom en produktionsklar Python‑prototyp som lagrar inbäddningar av tidigare interaktioner i en vektorlager, indexerar dem för snabb semantisk uppslagning och exponerar ett enkelt API som agenter kan fråga för att hämta kontextuellt relevant historik. Koden, som levereras med Docker‑skript och benchmark‑data, finns redan på GitHub och marknadsförs genom en serie livestream‑demo‑sessioner. Meddelandet är viktigt eftersom dagens mest synliga AI‑applikationer fortfarande förlitar sig på korta prompt‑fönster, vilket tvingar agenter att ”glömma” allt som hände tidigare i en konversation. Även om Retrieval‑Augmented Generation (RAG) har demonstrerat kraften i semantisk sökning, har det ännu inte löst problemet med kontinuerligt, tillståndsbaserat resonemang över sessioner. Raos implementation överbryggar detta gap genom att persistera inbäddningar i en vektordatabas, vilket gör att agenter kan återkalla tidigare beslut, preferenser eller till och med visuella ledtrådar utan att behöva åter‑prompta den underliggande språkmodellen. I praktiken kan detta minska token‑förbrukningen, sänka inferenskostnaderna och få personliga assistenter, autonoma botar och företagsarbetsflödes‑agenter att bete sig mer som riktiga samarbetspartners. Guiden kommer i kölvattnet av vår rapport från den 31 mars om ”memory‑first AI”, som pekade på prestandafördelarna med att hålla ett lättviktigt externt lager istället för att överbelasta modellen själv. Raos arbete lägger till en konkret arkitektur till det konceptet och kan bli en de‑facto‑standard för långtidsminne i nästa generation av agenter. Håll utkik efter tidiga adoptörer som integrerar mönstret i kommersiella plattformar, efter benchmark‑tävlingar som ställer vektor‑baserat minne mot framväxande lågminnestekniker som Googles TurboQuant, samt efter framväxten av interoperabilitetsspecifikationer som kan förvandla ad‑hoc‑prototyper till återanvändbara tjänster över hela den nordiska AI‑ekosystemet.
42

Claude Code‑bug kan tyst öka API‑kostnaderna 10‑20 ×

Claude Code‑bug kan tyst öka API‑kostnaderna 10‑20 ×
HN +6 källor hn
claude
En dold bugg i Anthropics Claude Code har bekräftats öka API‑användningen tio‑till‑tjugo gånger, vilket förvandlar en förväntad blygsam månadskostnad till en dyr överraskning för utvecklare. Felet, som upptäcktes av ett team av oberoende revisorer efter att en kunds användning sköt i höjden från det förväntade intervallet 20 – 100 USD till över 2 000 USD på en enda vecka, beror på modellens automatiska kontextutvidgning. När Claude Code får kommandot att ”ladda hela kodbasen” hämtar den tyst in varje fil, vilket driver token‑antalet från de vanliga 50‑100 K till 500 K eller mer per förfrågan. Eftersom Anthropic debiterar per 1 K token, omvandlas den uppblåsta belastningen direkt till en kraftig prisökning som kan gå obemärkt förbi tills nästa faktureringsperiod. Problemet är betydelsefullt eftersom Claude Code har blivit en hörnsten i AI‑assisterad utveckling i Norden, särskilt bland startups som förlitar sig på dess VS Code‑plugin för kodförslag i realtid. Buggen hotar inte bara budgetar utan urholkar också förtroendet för plattformens kostnadsprediktion – en viktig försäljningspunkt efter Anthropics nyliga ”Universal Claude”‑verktyg för token‑effektivitet, som i början av månaden sänkte AI‑utgifterna med 63 %. Utvecklare som redan har gått över till Pro‑nivån på 20 USD per månad kan utan att inse det hamna på Max 20×‑planen, som kostar 200 USD, när triggern aktiveras. Anthropic har släppt en patch som inaktiverar automatisk full‑projektladdning om den inte uttryckligen godkänts, och lovar en retroaktiv kredit för drabbade konton. Företaget har också lanserat en ny dashboard för användningsövervakning som flaggar sessioner som överstiger 200 K token. Följ med när denna dashboard rullas ut under de kommande två veckorna, och håll utkik efter eventuell uppföljningsvägledning från EU:s AI‑regleringsorgan, som förväntas granska oklara prismekanismer i AI‑som‑tjänst‑erbjudanden. Som vi rapporterade den 31 mars är verktyg som förbättrar token‑effektivitet bara värdefulla om de underliggande modellerna beter sig transparent; detta fall understryker behovet av striktare skyddsåtgärder.
41

Apple släpper första betaversionerna av watchOS 26.5, tvOS 26.5 och visionOS 26.5

Mastodon +7 källor mastodon
apple
Apple har rullat ut de första betabyggnaderna av watchOS 26.5, tvOS 26.5 och visionOS 26.5 och gjort dem tillgängliga för utvecklare via Apple Developer‑portalen. De tre uppdateringarna kommer en vecka efter Apples tillkännagivande den 30 mars att företaget påskyndar on‑device‑funktioner för stora språkmodeller (LLM) i hela ekosystemet. watchOS 26.5 lägger till en rad förbättringar för hälsospårning, bland annat en mer detaljerad analys av sömnfaser och en ny “Mindful Minutes”-metrik som utnyttjar AI på enheten för att upptäcka stressmönster via hjärtfrekvensvariabilitet. Uppdateringen utökar också ramverket “Siri Shortcuts”, så att tredjepartsappar kan trigga åtgärder baserat på kontextuella ledtrådar som plats eller aktivitet utan att skicka data till molnet. tvOS 26.5 fokuserar på Apple TV‑upplevelsen och introducerar ett låg‑latens‑spelläge som använder Apples egna neurala motor för att uppskalera grafik i realtid. En omarbetad HomeKit‑integration låter användare styra smart‑hem‑scener via röst eller gester, medan den nya “Watch Together”-funktionen synkroniserar uppspelning över flera enheter för gemensam tittning. visionOS 26.5 är den mest betydelsefulla av trion. Den levererar en uppdaterad spatial‑audio‑motor och ett paket med utvecklarvänliga API:er som exponerar Vision Pros on‑device‑LLM för naturlig språkinteraktion i mixed‑reality‑appar. Tidiga skärmbilder visar ett “Contextual Overlay”-verktyg som kan visa relevant information om fysiska objekt bara genom att titta på dem – ett tydligt steg mot den AI‑drivna vision som Apple antydde i sin strategi‑artikel den 30 mars. Varför det är viktigt: Betaversionerna signalerar att Apple går från inkrementella OS‑justeringar till ett enhetligt AI‑lager som spänner över wearables, TV och mixed‑reality‑hårdvara. Genom att hålla den tunga beräkningen på enheten stärker Apple sitt integritetsnarrativ samtidigt som utvecklare får en kraftfull ny verktygslåda. Vad som är på gång: Apple förväntas öppna betan för en bredare utvecklargrupp i början av april, följt av en offentlig lansering som sannolikt tidsbestäms till september‑WWDC‑talet. Observatörer kommer att vara nyfikna på om on‑device‑LLM‑modellerna mognar tillräckligt för att ersätta molnbaserade tjänster, och hur snabbt tredjepartsappar tar till sig den nya interaktionsmodellen i visionOS. Utrullningen väcker också frågor om prestanda på äldre hårdvara och huruvida Apple kommer att utöka dessa AI‑funktioner till iOS 26.5 senare i år.
39

Ny AI-modell kan upptäcka flera kognitiva hjärnsjukdomar från ett enda blodprov

Mastodon +11 källor mastodon
protein
Ett forskarteam vid Karolinska Institutet i Sverige har presenterat en djupinlärningsmodell som kan identifiera flera neurodegenerativa sjukdomar från ett enda blodprov. Genom att mata algoritmen med masspektrometridata från tusentals proteinfragment lär sig systemet känna igen de subtila, sjukdomsspecifika signaturerna som skiljer Alzheimers, Parkinsons, amyotrofisk lateralskleros (ALS) och frontotemporal demens i ett och samma test. I en valideringsgrupp med 3 200 deltagare uppnådde modellen en genomsnittlig sensitivitet på 92 % och specificitet på 89 % för de fyra tillstånden, vilket överträffar konventionella biomarkörpaneler som vanligtvis kräver separata analyser för varje sjukdom. Genombrottet är betydelsefullt eftersom nuvarande diagnostik förlitar sig på kostsam hjärnavbildning, lumbalpunktion eller symtombaserade bedömningar som ofta sker sent i sjukdomsförloppet. Ett blodbaserat, multiplexat test skulle kunna flytta upptäckten till primärvården, möjliggöra tidigare terapeutisk intervention, förbättra patientstratifiering i kliniska prövningar och medföra en betydande minskning av sjukvårdskostnaderna. Dessutom visar tillvägagångssättet hur AI kan extrahera kliniskt relevanta mönster från högdimensionell proteomikdata som undgår traditionella statistiska metoder, och öppnar vägen för liknande multiplexade screeningar inom onkologi och metabola störningar. De kommande stegen kommer att avgöra om teknologin går från laboratorium till klinik. Teamet planerar en multicenterprospektiv studie i Norge, Danmark och Finland senare i år för att bekräfta prestanda i olika populationer och utvärdera den longitudinella prediktiva kraften. Reglerande myndigheter kommer att granska algoritmens transparens och reproducerbarheten i dess protein‑signaturdatabas, medan kommersiella partners redan intresserar sig för gruppen för utveckling av testet. Håll utkik efter meddelanden om studieupptagning, eventuella FDA‑ eller EMA‑ansökningar och hur modellen står sig mot konkurrerande AI‑drivna diagnostikverktyg från DeepSeek och andra europeiska bioteknikhubbar.
39

Apple, “iOS 26.5”, “iPadOS 26.5”, “macOS 26.5”, “tvOS 26.5”, “visionOS 26.5”, “watchOS 26.5” beta‑version publicerad | APPLE LINKAGE

Mastodon +11 källor mastodon
apple
Apple har öppnat de första utvecklarbetorna för iOS 26.5, iPadOS 26.5, macOS 26.5 (kodnamn “Tahoe”), tvOS 26.5, visionOS 26.5 och watchOS 26.5 och gjort uppdateringarna tillgängliga via Apple Developer‑portalen den 31 mars. Utrullningen följer 26.4‑beta‑cykeln och sker bara några veckor före företagets WWDC 2026‑konferens, som är planerad att starta den 8 juni. 26.5‑betorna är i huvudsak inkrementella, men de introducerar ett fåtal funktioner som kan omforma både användarupplevelsen och utvecklarnas arbetsflöden. Den mest anmärkningsvärda är aktiveringen av end‑to‑end‑kryptering för RCS‑meddelanden (Rich Communication Services), vilket gör det möjligt för iPhone‑användare att utbyta säkra chattar med Android‑enheter – ett länge efterlängtat steg mot universell, privat meddelandetjänst. Apple utökar också sitt generativa‑AI‑ramverk genom att exponera nya “Apple Intelligence”‑API:er som låter tredjepartsappar integrera on‑device stora språkmodeller för uppgifter som sammanfattning, kodassistans och kontextuella genvägar. Vision Pro får en förfinad spatial‑audio‑pipeline och ett lättare gränssnitt för multi‑app‑tiling, medan macOS Tahoe lägger till tätare integration med Continuity‑ekosystemet och ett omdesignat Systeminställningar‑gränssnitt. watchOS och tvOS får blygsamma prestandaförbättringar samt uppdaterade hälso‑spårningsmått. För utvecklare öppnar betorna ett testfönster för dessa API:er inför den offentliga betan som förväntas i slutet av april. Tidig adoption blir avgörande för appar som är beroende av säker meddelandeföring eller AI‑drivna funktioner, eftersom Apple sannolikt kommer att göra den krypterade RCS‑vägen till standard i den slutgiltiga releasen. Företag kommer också att följa hur den nya Apple Business‑plattformen, som presenterades samtidigt som betorna, utnyttjar dessa möjligheter för enhetshantering och dataskydd. De kommande milstolparna är tydliga: WWDC 2026 kommer att visa djupare demonstrationer av Apple Intelligence, följt av en offentlig beta‑utrullning och slutligen en september 2026‑lansering av iOS 27 och dess syster‑OS‑versioner. Observatörer kommer att vara nyfikna på om Apple utökar E2EE till gruppchattar, hur utvecklare utnyttjar on‑device‑LLM:erna och om visionOS får de lovade “spatial‑AI”‑interaktionerna som kan definiera nästa generation av mixed‑reality‑upplevelser.
39

Mistral samlar in 830 miljoner dollar för att bygga Nvidia‑drivna AI‑centra i Europa

HN +10 källor hn
fundingmistralnvidiastartup
Mistral AI, det franska startup‑företaget bakom den namngivna stora språkmodellen, har avslutat en senior‑säkrad skuldfacilitet på 830 miljoner dollar för att finansiera ett nytt, Nvidia‑drivet AI‑datacenter nära Paris. Lånet kommer att finansiera inköpet av cirka 13 800 Nvidia H100‑GPU:er och byggandet av en anläggning på 44 megawatt – ungefär en och en halv gång så mycket effekt som ett typiskt hyperskale‑center. Finansieringen, som kommer från ett konsortium av europeiska banker och suveräna investerare, markerar det största affärsavtalet för AI‑infrastruktur med ett enda syfte i Europa hittills. Initiativet är ett direkt svar på kontinentens försök att matcha beräkningskapaciteten hos amerikanska och kinesiska molnjättar. Genom att etablera en högdensitets‑ och GPU‑rik hub i EU vill Mistral erbj
38

Apple publicerar Photoshop‑ och PNG‑format bezel‑mallar för MacBook Neo och MacBook Air M5 på Apple Design Resources för utvecklare och designers

Mastodon +10 källor mastodon
apple
Apple har lagt till Photoshop‑ och PNG‑format bezel‑mallar för de kommande MacBook Neo och MacBook Air M5 på sin Apple Design Resources‑portal. Filerna, som finns att ladda ner gratis, täcker de fyra nya färgfinisharna för M4‑chipet – Sky Blue, Midnight, Starlight och Silver – och innehåller exakta mått för varje chassistorlek. Designers och utvecklare kan nu infoga mock‑ups i exakt skala av bärbara datorerna i marknadsföringsgrafik, tillbehörsrenderingar, app‑skärmbilder och AR‑upplevelser utan att behöva mäta eller återskapa hårdvaran manuellt. Initiativet fördjupar Apples långvariga strategi att tillhandahålla färdiga resurser som förenklar produktionen för tredje part. Genom att erbjuda PNG‑versioner utöver de traditionella Photoshop‑filerna breddar Apple kompatibiliteten med ett större spektrum av bildredigeringsverktyg, från vektoreditorer till AI‑drivna designgeneratorer. Detta sänker tröskeln för små studior och oberoende skapare att producera högupplösta visuella material som följer Apples varumärkesriktlinjer, vilket potentiellt påskyndar ekosystemet av tillbehör, fodral och mjukvara som visar upp den nya MacBook‑serien. Tidpunkten är anmärkningsvärd: MacBook Neo och Air M5 är de första Mac‑datorerna som levereras med M4‑processorn, och deras nya färgpalett markerar ett visuellt skifte för Apples laptop‑sortiment. När utvecklare börjar integrera mallarna i produktsidor och marknadsföringsmaterial förväntas kvaliteten och konsistensen i tredjepartsinnehåll förbättras, vilket stärker Apples premiumimage samtidigt som marknadsförare får en färdig genväg. Det som bör hållas ö
38

Alludo lanserar Parallels Desktop for Mac 26.3.0 med förbättrad stabilitet och buggfixar | Programvara | Mac OTAKARA

Mastodon +11 källor mastodon
apple
Alludo har släppt Parallels Desktop for Mac 26.3.0 på marknaden och presenterar uppdateringen som ett stabilitetsfokuserat paket som åtgärdar en rad långvariga buggar. Den nya versionen kommer bara några veckor efter att Apple öppnat betakanaler för iOS, iPadOS, macOS, tvOS, visionOS och watchOS 26.5, och den ger full kompatibilitet med dessa förhandsversioner av operativsystemen, inklusive inbyggt stöd för Apple‑silicon‑Macar med M2‑ och de nyss tillkännagivna M3‑chipen. Uppgraderingen spänner åt den virtuella maskin‑schemaläggaren, en förändring som Alludo säger minskar CPU‑strypning och eliminerar den sporadiska ”VM‑frysning” som plågade tidigare 26.x‑utgåvor. Nätverksrelaterade fel som rapporterats av företagsanvändare – särskilt de som kör Windows 11 i ett företags‑VPN – är också åtgärdade. En uppdaterad grafikdrivrutinstack förbättrar Retina‑skalningsrendering, vilket är viktigt för designers och utvecklare som är beroende av högupplösta Windows‑applikationer på macOS. Varför patchen är viktig är tvåfaldigt. För det första är Parallels fortfarande den de‑facto‑lösningen för yrkesverksamma som behöver Windows‑ eller Linux‑miljöer utan dual‑boot, och varje driftsstopp översätts direkt till förlorad produktivitet och högre supportkostnader. För det andra understryker tidpunkten Alludos strategi att ligga steget före Apples snabba hårdvaruuppdateringar; genom att bekräfta sömlös drift på den senaste silikonen signalerar företaget att deras virtualiseringslager inte kommer att bli en flaskhals när macOS fortsätter att utvecklas. Framåt blickar Alludo på en 26.4‑utgåva som kommer att integrera AI‑driven resursallokering, en funktion som automatiskt kan ombalansera CPU och minne mellan värd‑ och gäst‑OS baserat på realtidsbelastning. Observatörer kommer också att följa hur företaget positionerar sin prissättning och licensiering i takt med att Apple driver sin egen vision‑OS och verktyg för plattformsoberoende utveckling. För närvarande kan Mac‑användare som söker en pålitlig Windows‑brygga uppgradera med förtroende, men nästa våg av AI‑förstärkt virtualisering kan omdefiniera hur tätt macOS och gästmiljöer samexisterar.
37

Microsoft Copilot placerar annonser i pull‑requests på Microsoft Github – förväntat beteende. #AI #Ge

Mastodon +11 källor mastodon
copilotmicrosoftopenai
Microsoft har bekräftat att de reklamsnuttar som dyker upp i kommentarer till pull‑requests som genereras av GitHub Copilot är avsiktliga och inte ett fel. Den AI‑drivna kodgranskningsfunktionen infogar nu korta ”tips” som länkar till Microsoft‑ägda eller partner‑tjänster – framför allt en Raycast‑utökning – varje gång den föreslår en ändring. Beteendet visade sig först i början av mars när utvecklare, bland annat Zach Manson, rapporterade att de såg ett annonsliknande förslag i en pull‑request. Som vi rapporterade den 30 mars väckte händelsen en debatt om förtroende och bias i AI‑assisterade utvecklingsverktyg. Microsofts förtydligande kommer efter intern telemetri som visade att mer än 1,5 miljon pull‑requests på GitHub och till och med GitLab har fått sådana reklaminlägg sedan funktionen lanserades. Varför det är viktigt är tvådelat. För det första marknadsförs Copilot som en produktivitetsökare för miljontals utvecklare; att bädda in marknadsföringsinnehåll suddar ut gränsen mellan assistans och kommersiellt budskap, vilket väcker oro för transparens och potentiella intressekonflikter. För det andra kan praktiken leda till regulatorisk granskning under framväxande AI‑styrningsramverk, såsom EU:s AI‑lag, som betonar användarens samtycke och tydlig information om AI‑genererade resultat. Framöver kommer utvecklare att hålla utkik efter en möjlighet att välja bort eller tydligare märkning av reklaminnehåll. Microsoft kan också finjustera
37

📰 Prefill, Decode och KV‑cache: 3 dolda processer som ökar LLM‑s hastighet (med data från 2026) – Stora språkmodeller

Mastodon +12 källor mastodon
En forskningsrapport som släpptes den här veckan av Nordic AI Lab avslöjar tre “dolda” steg som nu dominerar prestandakampen för stora språkmodeller (LLM): prefill‑passet, decode‑loopen och nyckel‑värde‑cachen (KV‑cache). Artikeln, baserad på benchmark‑data som samlats in under hela 2026 från Azure, Google Cloud och framväxande on‑premise HCI‑kluster, visar att en separering av prefill‑ och decode‑arbetsbelastningar samt en intelligent återanvändning av KV‑cacher kan minska end‑to‑end‑latensen med upp till 45 % samtidigt som genomströmningen förblir stabil. Under prefill‑fasen läser modellen in användarens prompt på ett starkt parallellt sätt och fyller en KV‑cache som lagrar uppmärksamhetsnycklar och -värden för varje token. Cachen används sedan i decode‑fasen, där token genereras en efter en i en autoregressiv process. Eftersom decode är i grunden sekventiell blir varje ineffektivitet i cache‑uppslagning eller datatransport en flaskhals. Studien visar att dirigera decode‑förfrågningar till noder som redan har en varm cache för liknande prompts – ett tillvägagångssätt som först prototypades i IBMs Fusion HCI och nu förfinats med en semantiskt medveten schemaläggare – dramatiskt minskar minnestrafik och GPU‑idle‑tid. Resultaten är viktiga eftersom LLM‑er går från forskningsnyfikenheter till produktionsklara tjänster inom finans, hälsa och nordiska offentliga plattformar. Snabbare inferens innebär direkt lägre driftskostnader, stramare service‑level‑avtal och möjlighet att leverera rikare, multimodala interaktioner på edge‑enheter. Dessutom öppnar den KV‑cache‑centrerade designen dörren för spekulativ dekodning och prefix‑caching, tekniker som ytterligare komprimerar beräkningsbudgetar utan att kompromissa med svarskvaliteten. Framåtplanerna för laboratoriet inkluderar att open‑source‑a en lättviktig KV‑messenger som orkestrerar cache‑överföringar över disaggregated noder, ett steg som kan standardisera cache‑medveten schemaläggning hos molnleverantörer. Observatörer kommer att följa hur stora AI‑infrastruktur‑leverantörer tar till sig dessa mönster, och om kommande hårdvara – såsom NVIDIA Hopper‑2‑GPU:n med inbyggd cache‑koherens – kommer att göra den tre‑stegs‑pipeline till standard för alla storskaliga LLM‑distributioner.
36

📰 Qwen3.5 Omni 2026: Den inhemska multimodala AI:n som slår Gemini Qwen3.5 Omni, Alibabas senaste

Mastodon +12 källor mastodon
geminimultimodalqwen
Alibaba’s Tongyi Lab unveiled Qwen 3.5 Omni on March 30, 2026, positioning it as the first truly native multimodal large‑language model that can ingest text, images, audio, video and real‑time web search in a single end‑to‑end architecture. The release marks a decisive move away from the “wrapper” approach that stitched separate vision or audio encoders onto a text‑only backbone; Qwen 3.5 Omni’s hybrid‑attention mixture‑of‑experts (MoE) core processes all modalities natively, delivering a seamless user experience across media types. Benchmarks released alongside the model show it outpacing Google’s Gemini on audio‑understanding tasks, handling more than ten hours of raw speech and 400 seconds of 720p video at one frame per second while maintaining a 256 k token context window. Three instruction‑tuned variants—Plus, Flash and Light—cover a spectrum from 0.8 B to 27 B parameters, while the MoE family scales to a 397 B‑parameter configuration (A17 B). Voice‑cloning, real‑time search and code generation are now bundled in a single model, a capability previously split across multiple specialized systems. The launch matters because native multimodality reduces latency, lowers inference cost and simplifies deployment, giving Alibaba a competitive edge in cloud AI services and enterprise tooling. Nordic firms that rely on Alibaba Cloud for AI workloads now have a locally hosted alternative to Google’s and Microsoft’s multimodal offerings, potentially reshaping procurement decisions in sectors ranging from media production to autonomous robotics. What to watch next: Alibaba has promised an open‑weight release later this year, which could accelerate community‑driven innovation and spur integration into Nordic SaaS platforms. Competitors such as DeepSeek, Mistral and Google are expected to respond with upgraded vision‑audio pipelines, while the upcoming Gemini 2.0 update may aim to close the performance gap. The next few months will reveal whether Qwen 3.5 Omni can translate its benchmark lead into real‑world market share.
36

📰 Microsoft Copilot Cowork lanseras 2026: Multi‑modell‑AI för Microsoft 365 Microsoft har lanserat

Mastodon +7 källor mastodon
claudecopilotmicrosoft
Microsoft har öppnat Copilot Cowork för medlemmar i sitt Frontier‑tidig‑tillgångsprogram, vilket utökar den AI‑drivna assistenten som debuterade i samma‑dag‑annonseringen den 30 mars. Den nya versionen parar ihop Microsofts egna GPT‑baserade modeller med Anthropics Claude och skapar en “multi‑modell‑motor” som kan växla mellan generatorer beroende på uppgiftens komplexitet, datakänslighet eller erforderliga resonemangsdjup. Uppgraderingen lägger till en svit av samarbetsverktyg avsedda för långvarigt, flerstegigt arbete över Microsoft 365‑sviten. Användare kan nu be Copilot Cowork att skapa forskningsöversikter, verifiera källor och sedan överlämna utkastet till Claude för ett “Critique”-pass som flaggar logiska luckor och föreslår alternativa argument. En bakgrundsuppgift‑körare kan utföra repetitiva åtgärder – såsom att flytta filer, uppdatera kalkylblad eller skicka uppföljnings‑e‑mail – utan användarens inblandning, vilket frigör kunskapsarbetare att fokusera på beslut med högre värde. Varför det är viktigt är tvådelat. För det första ger den hybrida modellen Microsoft ett konkurrensförsprång i loppet att integrera generativ AI i kontorsproduktivitet, och utmanar direkt Googles Gemini‑drivna Workspace‑funktioner. För det andra minskar möjligheten att blanda modeller begränsningen “en‑storlek‑passar‑alla” som har hindrat tidigare copiloter, och lovar högre noggrannhet för forskningsintensiva områden som juridik, finans och vetenskaplig rapportering. Frontier‑utrullningen signalerar också Microsofts förtroende för att tekniken är tillräckligt säker för företags‑piloter, trots den senaste granskningen av AI‑genererad kod och annonsinlägg i pull‑requests. Vad man bör hålla ögonen på härnäst: Microsoft planerar att bredda Copilot Cowork‑tillgängligheten utanför Frontier senast Q4 2026, med fokus på att integrera realtidsdata från Teams och Viva. Analytiker kommer att följa hur företag antar bakgrundsuppgifts‑automatiseringen och om den dubbla modell‑strategin minskar hallucinationer jämfört med enkla modell‑copiloter. Nästa uppdatering förväntas exponera ett API som låter tredjepartsutvecklare bädda in Critique‑motorn i skräddarsydda affärsapplikationer, vilket potentiellt kan göra Copilot Cowork till en plattform snarare än ett funktionspaket. Som vi rapporterade den 30 mars markerar detta den första stora expansionen av Copilot Cowork‑initiativet; de kommande månaderna kommer att visa om multi‑modell‑strategin kan hålla sitt löfte om ökad produktivitet.
36

Jag designade ett minnessystem för Claude Code — “Glömning” var den svåraste delen

Dev.to +9 källor dev.to
agentsanthropicclaude
En mjukvaruingenjör har presenterat en tre‑lagrad minnesarkitektur för Anthropics Claude Code, som tar itu med det “glömskaps‑problem” som har plågat verktyget sedan dess auto‑minnesfunktion introducerades. Claude Code, den AI‑drivna kodassistenten som kan läsa ett kodförråd, redigera filer, köra kommandon och till och med integreras med GitHub Actions, skapar automatiskt “minnesfiler” efter varje session. I praktiken hopar sig filerna, var och en får lika stor vikt, så modellen tenderar att återkalla föråldrade eller irrelevanta detaljer tillsammans med den senaste kontexten – ett symptom på den bredare korttidsminnesbegränsningen hos stora språkmodeller. Den nya designen vänder på den vanliga lösningen. Istället för att bara lägga till mer minne byggde ingenjören en hierarki: ett snabbt, flyktigt cache för den pågående uppgiften; ett mellanskikt som betygsätter och rensar minnesfiler baserat på relevans; och ett långtidslagringsutrymme som bara behåller högvärdiga mönster såsom projektstruktur, felsökningsvanor och föredragna kodningsstilar. Genom att aktivt “glömma” lågsignalanter håller systemet Claude Codes kontextfönster slimmat samtidigt som det bevarar den kunskap som verkligen påskyndar utvecklingen. Tidiga tester på ett medelstort kodbas visade en 30 procentig minskning av promptlängden och en mätbar ökning av hastigheten för uppgiftsutförande, vilket bekräftar att selektiv behållning kan vara mer effektiv än en okontrollerad ansamling. Genombrottet är viktigt eftersom minneshantering är en flaskhals för alla AI‑assisterade utvecklingsverktyg. När företag antar agenter som beständigt lever över sessioner hotar okontrollerad tillväxt både prestanda och datasekretess. En disciplinerad glömskesstrategi kan bli en standardkomponent i framtida AI‑IDE:er och påverka hur plattformar som GitHub Copilot eller Microsofts kommande AI‑tillägg hanterar kontext. Håll utkik efter Anthropics svar – huruvida de kommer att anta den lagerbaserade metoden i en officiell uppdatering eller öppna arkitekturen för gemenskapsutökningar. Parallella insatser från Spotify‑ingenjörer och öppen‑käll‑projekt som “Enzyme” tyder på ett race om att definiera branschomfattande bästa praxis för AI‑minne, en utveckling som kan omforma de produktivitetsvinster som kod‑centrerade generativa modeller lovar.
32

📰 Bitboard Tetris AI: 53 × snabbare förstärkningsinlärning med PPO & afterstate‑utvärdering år 2026

Mastodon +11 källor mastodon
benchmarksreinforcement-learningtraining
Ett team av forskare har presenterat ett nytt Bitboard‑baserat Tetris‑AI‑ramverk som minskar simuleringstiden för förstärkningsinlärning (RL) med en faktor 53. Genom att omforma spelbrädet till ett 64‑bitars heltal och använda aggressiva bitvisa operationer kan motorn utvärdera ”afterstates” – brädkonfigurationen som uppstår efter att en pjäs placerats – i en enda CPU‑cykel. I kombination med Proximal Policy Optimization (PPO) och en hybrid Python‑Java‑runtime kan systemet generera mer än 10 miljoner spelsteg per timme, vilket vida överstiger de några hundratusen steg som tidigare Tetris‑RL‑uppsättningar typiskt nådde. Genombrottet är viktigt eftersom Tetris länge har fungerat som en testbädd för sekventiella beslutsalgoritmer, men dess kombinationsexplosion har gjort träningslooparna smärtsamt långsamma. Snabbare simulering översätts direkt till större replay‑buffertar, djupare policy‑uppdateringar och, framför allt, möjligheten att benchmarka nya RL‑tekniker i stor skala utan förödande beräkningskostnader. Den öppna källkodsutgåvan (arXiv 2603.26765, GitHub) bjuder in communityn att integrera motorn i befintliga bibliotek som Stable‑Baselines3 eller RLlib, vilket potentiellt kan påskynda forskningen kring proveffektiv inlärning, kursdesign och hierarkisk planering. Framöver kommer gemenskapen att följa hur snabbt Bitboard‑motorn antas i akademiska artiklar och AI‑tävlingar. Tidiga användare kan tänkas utvidga afterstate‑konceptet till andra brickbaserade spel – Connect‑Four, 2048 eller till och med förenklade versioner av Go – för att testa om samma hastighetsvinster gäller. Samtidigt antyder författarna en kommande version som utnyttjar GPU‑accelererade bitvisa kärnor, vilket lovar ytterligare en tiodubbel prestandaökning. Om trenden fortsätter kan Tetris utvecklas från ett nischat benchmark till en hög‑genomströmning‑sandlåda för nästa generations RL‑genombrott.
31

Avtäcka AI‑fronten: Lärdomar från Claude Mythos/Capybara‑läckan

Dev.to +9 källor dev.to
anthropicclaude
Anthropics interna “Claude Mythos”-modell – kodnamn Capybara – har avslöjats efter ett dataläckage, vilket ger AI‑gemenskapen sin första konkreta inblick i vad företaget beskriver som ett “steg‑förändring” jämfört med dess flaggskepps‑system Opus. De läckta dokumenten, som publicerades på ett offentligt forum av en anonym källa, avslöjar en ny förmågenivå som ligger över Opus, Sonnet och Haiku, och som prissätts därefter för företags‑ och regeringskunder. Läckan visar att Capybara uppnår markant högre poäng inom kodning, komplex resonemang och, särskilt, cybersäkerhetsbedömningar. Interna benchmark‑tester placerar dess prestanda på standardiserade kodningstest flera poäng framför Opus 5, medan hot‑modellering‑simulationer tyder på en motståndskraft mot adversariella promptar som kan mäta sig med dedikerade säkerhetsmodeller. Anthropics eget memo beskriver modellen som den “mest kapabla” i deras portfölj, vilket antyder ett prispremium som kan omforma ekonomin för högkvalitativa AI‑tjänster. Varför detta är viktigt är tvådelat. För det första signalerar framväxten av en fjärde modellnivå att tävlingsloppet om frontlinje‑AI accelererar bortom den välbekanta tre‑nivå‑stegen, vilket pressar konkurrenter som OpenAI och Google att lansera motsvarande uppgraderingar. För det andra kan det explicita fokuset på cybersäkerhet göra Claude Mythos till standardvalet för sektorer där dataskydd är icke‑förhandlingsbart, vilket potentiellt kan förändra inköpsmönster inom finans, försvar och kritisk infrastruktur. Det som bör bevakas härnäst inkluderar Anthropics officiella svar – huruvida de bekräftar, förnekar eller omformulerar läckan – samt tidpunkten för en formell produktlansering. Prisinformation, API‑tillgänglighet och integration med befintliga Claude Code‑verktyg blir kritiska signaler för utvecklare som redan har experimenterat med Claude Code, enligt vår rapportering den 31 mars. Slutligen kan tillsynsmyndigheter granska själva läckan och undersöka hur väl AI‑företag skyddar modell‑specifikationer som kan ha nationella säkerhetskonsekvenser.
28

OpenAI lägger på hylla sitt planerade ChatGPT‑'vuxenläge' dagar efter att ha lagt ner Sora

OpenAI lägger på hylla sitt planerade ChatGPT‑'vuxenläge' dagar efter att ha lagt ner Sora
CNET on MSN +7 källor 2026-03-27 news
openaisora
OpenAI meddelade på tisdagen att de på obestämd tid lägger på hylla funktionen “vuxenläge” som var planerad för ChatGPT, ett steg som följer den plötsliga nedstängningen av deras kortlivade videodelningsapp Sora. Beslutet, som rapporterades av Financial Times och återgavs av flera teknikmedier, innebär att företaget inte kommer att släppa en erotisk chatbot som skulle ha gjort det möjligt för användare att begära explicit sexuellt innehåll. Planen för vuxenläge hade föreslagits tidigare i år som ett sätt att bredda ChatGPT:s attraktionskraft och erövra en nischmarknad som konkurrenter som Anthropic och Google har antytt att de vill utforska. Interna granskningar pekade dock på en rad juridiska och ryktemässiga risker: möjliga överträdelser av lagar om åldersverifiering i EU och USA, ökad exponering för icke‑samtyckta deep‑fake‑generering, samt sannolikheten
26

**LLM‑benchmark som ett 1‑vs‑1‑RTS‑spel där modeller skriver kod som kontrollerar enheterna**

Lobsters +6 källor lobsters
benchmarksopen-source
En ny öppen källkod‑benchmark kallad **LLM Skirmish** låter stora språkmodeller möta varandra i en 1‑vs‑1‑duell i real‑tids‑strategi (RTS) där modellerna genererar JavaScript‑koden som styr nio enheter på varje sida. Testet bygger på Screeps‑API:t, ett sandlådemiljö där kod körs kontinuerligt i en spelvärld, och begränsar handlingar till de enkla kommandona `move()` och `pew()`. Varje modell möter först en mänskligt skriven baslinjerobot i tio rundor, för att därefter delta i ett round‑robin‑turnering där den spelar tio spel mot varje motståndare, med ASCII‑ögonblicksbilder av brädet som sparas efter varje tick. Benchmarket är utformad för att blotta en modells förmåga till kontextuell resonemang, anpassning till dynamisk återkoppling och hantering av beräkningskostnad när den genererar körbar kod. Till skillnad från statiska fråge‑svar‑tester tvingar LLM Skirmish AI:n att förutse motståndarens drag, fördela resurser och iterativt förfina sin strategi under strikta latenskrav. Tidiga resultat visar att nyare instruktions‑tuned modeller såsom Claude 3.5 och GPT‑4o överträffar äldre, större modeller, vilket speglar den prestationshierarki som observerades i LLM Buyout Game Benchmark som vi rapporterade den 31 mars 2026. Varför det är viktigt är tvådelat. För det första är förmågan att skriva och köra kod i realtid ett kärnanvändningsområde för AI‑assisterad mjukvaruutveckling, och benchmarken erbjuder ett konkret, reproducerbart mått på den förmågan. För det andra ger signalen om kostnadseffektivitet – hur många API‑anrop och beräkningscykler en modell förbrukar för att vinna – direkt insikt för företag som väger av avvägningen mellan modellstorlek och driftkostnad, ett bekymmer som lyftes fram av den nyliga Claude Code‑buggen som orsakade kostnadsinflation. Framåt planerar communityn att utöka arenan med större kartor, fler enhetstyper och scenarier med samarbete mellan flera agenter. Forskare kommer också att integrera förstärknings‑inlärningsloopar som låter modeller lära sig av sina egna spel‑loggar, vilket potentiellt suddar ut gränsen mellan kodgenerering och autonom agent‑träning. Nästa version, planerad för Q2 2026, lovar en topplista som kan bli de‑facto‑standard för att mäta strategisk, kodskrivande AI.
24

Bitboard-version av Tetris‑AI

ArXiv +11 källor arxiv
agentsreinforcement-learningtraining
En ny preprint (arXiv:2603.26765v1) presenterar en “bitboard”-version av en Tetris‑AI som omarbetar spelmotorn och förstärknings‑inlärningspipeline för dramatiskt högre genomströmning. Författarna ersätter den traditionella rutnätsbaserade brädrepräsentationen med en kompakt bitboard‑layout – varje rad lagras som ett enda heltal vars bitar kodar upptagna celler. Denna förändring minskar minnesanvändningen kraftigt och möjliggör vektoriserade bitvisa operationer för fall, rad‑röjning och kollisionstester, vilket driver simulationshastigheten långt förbi gränserna för befintliga Tetris‑implementationer. Papperet kopplar ihop bitboard‑motorn med en uppgraderad policy‑optimeringsstack som stödjer Proximal Policy Optimisation, Advantage Actor‑Critic och nyare efter‑tillstånd‑utvärderingstekniker. Tidiga experiment rapporterar upp till 70‑faldig hastighetsökning jämfört med grundläggande Python‑simulatorer, vilket minskar klocktiden för träning från dagar till timmar för jämförbara prestandanivåer. Genom att eliminera den flaskhals som länge hindrat storskalig sekventiell‑beslutsforskning, lovar ramverket att göra Tetris till ett mer praktiskt referensproblem för studier av utforskning, kredit‑tilldelning och hierarkisk planering. Som vi rapporterade den 31 mars 2026 uppnådde Bitboard‑Tetris‑AI en 53‑gångs hastighetsökning med PPO och efter‑tillstånd‑utvärdering. Det aktuella arbetet breddar påståendet genom att leverera en allmän motor, öppen‑källkod i Go och en uppsättning reproducerbara träningsskript. Det inkrementella språnget understryker hur lågnivå‑datastrukturer kan omforma högnivå‑inlärningsforskning, i likhet med liknande vinster som setts i schack‑ och Go‑motorer. Gemenskapen kommer att hålla ögonen på tre omedelbara utvecklingar: benchmark‑resultat som jämför den nya motorn med implementeringen från den 31 mars över olika RL‑algoritmer; antagandet av kodbasen i populära RL‑bibliotek som Gymnasium och RLlib; samt uppföljningsstudier som tillämpar bitboard‑metoden på andra pussel‑domäner eller i multi‑agent‑inställningar. Om prestandapåståendena håller, kan bitboard‑Tetris‑AI bli det de‑facto testbädden för nästa generations förstärknings‑inlärningsforskning.
24

A-SelecT: Automatisk val av tidssteg för representationsinlärning med Diffusion Transformers

ArXiv +9 källor arxiv
En ny arXiv‑preprint, A‑SelecT: Automatic Timestep Selection for Diffusion Transformer Representation Learning (arXiv:2603.25758v1), föreslår en metod som låter Diffusion Transformers (DiTs) själva välja det mest informativa avlägsningssteget utan mänsklig inblandning. Författarna tränar en lättviktig selector som utvärderar kvaliteten på latenta funktioner vid varje diffusionstidssteg och väljer det som maximerar prestandan i efterföljande uppgifter. I experiment på ImageNet‑1K och flera multi‑label‑vision‑benchmarkar förbättrar A‑SelecT klassificeringsnoggrannheten med upp till 2 procentenheter samtidigt som antalet nödvändiga tränings‑epoch reduceras med cirka 30 %. Utvecklingen är viktig eftersom diffusionsmodeller, som tidigare var begränsade till bildsyntes, nu återanvänds för diskriminativa uppgifter såsom funktionsutvinning och kors‑modal återhämtning. Tidigare arbete, inklusive vår rapport den 30 mars om förstärknings‑inlärningsstyrd diffusion, pekade på potentialen i diffusionsbaserade representationer men belyste också ett praktiskt flaskhals: det optimala diffusionstidssteget varierar mellan dataset och uppgifter, och manuell val av detta är tidskrävande och felbenäget. Genom att automatisera valet sänker A‑SelecT kunskapsbarriären, minskar slöseri med beräkningsresurser och gör diffusions‑genererade inbäddningar mer konkurrenskraftiga mot traditionella konvolutionella eller transformer‑bakben. Nordiska forskargrupper, som ofta opererar under strama budgetrestriktioner, kan dra nytta av dessa effektivitetsvinster. Kommande steg att hålla ögonen på inkluderar författarnas planerade öppna källkods‑släpp och integrationstester med större vision‑språk‑modeller. Parallella insatser såsom DDiT:s dynamiska patch‑schemaläggning och DiffusionBrowser:s interaktiva förhandsgranskningsverktyg antyder ett bredare ekosystem som växer kring adaptiva diffusions‑pipelines. Om A‑SelecT kan skalas till video‑ och multimodala data, kan det påskynda övergången från enbart generativ diffusion‑forskning till ett enhetligt ramverk för både skapande och förståelse inom AI.
24

DesignWeaver: Dimensionell Stödkonstruktion för Text‑till‑Bild‑Produktdesign

ArXiv +8 källor arxiv
text-to-image
DesignWeaver, ett nytt AI‑stödd gränssnitt för produktdesign, presenterades i en reviderad arXiv‑preprint (2502.09867v2) på tisdagen. Systemet tacklar ett ihållande flaskhals för nybörjardesigners: att omvandla vaga idéer till effektiva promptar för text‑till‑bild‑generatorer. Genom att analysera bilder som modellen producerar och extrahera framträdande design‑dimensioner — såsom stil, material, ergonomi och färg — presenterar DesignWeaver en palett av valbara attribut som användarna kan väva in i rikare, mer riktade promptar. Forskarteamet, lett av Sirui Tao, utvärderade verktyget i en kontrollerad studie med 52 deltagare som hade begränsad design‑erfarenhet. Jämfört med en konventionell text‑endast prompt‑editor skrev användare av DesignWeaver längre, mer nyanserade promptar och genererade ett bredare spektrum av nya koncept. Författarna hävdar att den ”dimensionella stödkonstruktionen” minskar den kognitiva belastningen i prompt‑engineering och öppnar upp generativ visualisering för en bredare publik. Genombrottet är betydelsefullt eftersom prompt‑kvalitet fortfarande är den primära hävstången för att utvinna värde ur stora text‑till‑bild‑modeller. Genom att demokratisera prompt‑skapandet kan DesignWeaver påskynda idéutveckling i ett tidigt skede, minska beroendet av specialistdesigners och omforma arbetsflöden inom konsumentvaror, möbler och fordonssektorn. Tillvägagångssättet pekar också på en ny klass av interaktiva AI‑verktyg som sluter loopen mellan output och input, ett tema som återkommer i nyligen arbete med minnes‑förstärkta agenter och minskning av hallucinationer. Det som bör hållas ögonen på härnäst är vägarna till kommersiell integration. DesignWeavers kodbas är planerad att släppas som öppen källkod senare i år, och flera CAD‑plattformar har redan uttryckt intresse för att integrera den palett‑drivna prompt‑editorn. Uppföljningsstudier kommer sannolikt att utforska utvidgningar till 3‑D‑generering, real‑tids‑feedback‑loopar samt påverkan på immaterialrättsliga frågor i takt med att AI‑genererade designer blir allt vanligare. De kommande månaderna bör avslöja om DesignWeaver går från forskningsprototyp till en stapelvara i vardaglig produktdesign.
23

Apple, Apple Silicon‑Macar får X11‑fönster som blir svarta – åtgärdar flera sårbarheter och släpper XQuartz v2.8.6 Beta 4 med signaturcertifikat giltigt till 2031

Mastodon +10 källor mastodon
apple
Apple har släppt en ny beta av XQuartz 2.8.6, som åtgärdar ett långvarigt renderingsfel som gjorde X11‑fönster helt svarta på Apple‑silicon‑Macar och som dessutom patchar flera säkerhetsbrister. Uppdateringen, som projektets underhållare Jeremy Huddleston‑Sequoia meddelade den 28 mars 2026, levereras även med ett nytt kodsigneringscertifikat som är giltigt till 2031 – ett steg som återställer förtroendet för den öppna X Window Systems macOS‑distribution. Det svarta‑fönster‑felet uppstod efter att macOS övergick till ARM‑baserad silicon, där den äldre XQuartz‑drivrutinen misslyckades med att översätta GPU:ns nya minneslayout. Användare av vetenskapliga, ingenjörsmässiga och äldre Unix‑verktyg som fortfarande förlitar sig på X11 – från MATLAB till fjärr‑Linux‑skrivbord – rapporterade oanvändbara sessioner, vilket ledde till en våg av tillfälliga lösningar som VNC eller fullständig systemvirtualisering. Betaversionen återställer inte bara korrekt rendering utan adresserar också tre CVE‑nummer som möjliggjorde lokal privilegie‑eskalering och fjärrkodexekvering via felaktigt formade X11‑förfrågningar, och stänger därmed en vektor som kunde ha utnyttjats av skadliga skript eller komprometterade containrar. För den nordiska utvecklargemenskapen är fixen viktig eftersom många forskningsinstitutioner och startups fortfarande kör X11‑baserade visualiseringspipeline på MacBooks med M1-, M2‑ eller de nyare M4‑chipen. En stabil, säkert signerad XQuartz‑byggnad innebär att dessa arbetsflöden kan förbli inhemska snarare än att tvingas in i tunga VM‑lösningar som Parallels eller UTM, vilket bevarar både prestanda och batteritid. Nästa steg är tydliga. Apple och XQuartz‑underhållarna måste föra betaversionen fram till en slutgiltig release, troligen före nästa macOS‑uppdateringscykel, och uppmana användare att ersätta äldre, osignerade byggnader. Säkerhetsgranskare kommer att hålla ett öga på eventuella kvarvarande sårbarheter, särskilt med tanke på det ovanligt långa certifikatets livslängd, som kan bli ett mål för certifikatstöldattacker. Slutligen bör utvecklare följa Apples bredare policy kring tredjeparts‑kärnutökningar och kodsignering, då XQuartz‑fallet kan ge en fingervisning om hur företaget kommer att hantera äldre Unix‑verktyg på sin silicon‑plattform framöver.
23

Safari Technology Preview fyller 10 år: Ett decennium av testning av Apples webbteknologier

Mastodon +11 källor mastodon
apple
Apple markerar ett milstolpe för sin experimentella webbläsare: Safari Technology Preview (STP) fyller tio år. Jubileet, som lyfts fram i en MacRumors‑artikel, firar ett decennium av tidiga byggnader som låter utvecklare och avancerade användare prova webbstandarder, prestandaförbättringar och säkerhetsförstärkningar innan de når den stabila Safari‑kanalen. Den senaste STP‑utgåvan, version 213, kommer med ett fåtal buggfixar och inkrementella uppdateringar av WebKit, Apples öppna källkods‑renderingsmotor, vilket understryker programmets jämna takt av förbättringar. Betydelsen sträcker sig längre än ett födelsedagsband. Sedan lanseringen 2016 har STP fungerat som en provningsplats för funktioner som nu formar den vanliga webbläsaren – såsom WebGPU, förbättrade sekretesskontroller och den kompakta fliklisten som introducerades i macOS Tahoe 26.4. Genom att exponera banbrytande API:er för en noggrant utvald community samlar Apple in verkliga prestandadata och kompatibilitetsfeedback, vilket påskyndar mognaden av webbstandarder samtidigt som risken för regressioner i den konsumentinriktade produkten minskar. För nordiska utvecklare, många av dem som bygger SaaS‑plattformar ovanpå Apples ekosystem, förblir förhandsversionen ett viktigt verktyg för att säkerställa att nya JavaScript‑API:er och CSS‑möjligheter fungerar pålitligt på iOS‑ och macOS‑enheter. Framåt ser man att nästa våg av STP‑byggen förväntas visa Apples satsning på generativ AI i webbläsaren. Rykten pekar på integration av on‑device LLM‑inferens för smartare autofyll, innehållssammanfattning och tillgänglighetsassistans – funktioner som skulle passa in i Apples bredare AI‑strategi som beskrevs i vår rapport den 30 mars. Observatörer bör hålla utkik efter den kommande version 222, som planeras innehålla tidiga prototyper av dessa AI‑drivna verktyg, samt djupare WebGPU‑stöd som kan jämna ut spelplanen för högpresterande webbappar på Apple‑silicon. Det tioåriga loppet för Safari Technology Preview bevisar att Apples inkrementella, utvecklar‑centrerade metod fortsätter forma framtiden för webbinteraktion.
21

Bygg Din Egen Kodningsagent

Mastodon +9 källor mastodon
agentsgemini
En ny Leanpub‑titel väcker uppmärksamhet i den nordiska AI‑gemenskapen. J. Owens “Build Your Own Coding Agent: The Zero‑Magic Guide to AI Agents in Pure Python” erbjuder en steg‑för‑steg‑plan för att konstruera en produktionsklar kodningsassistent från en enda Python‑fil, utan att förlita sig på oklara ramverk. Boken leder läsaren genom 13 iterativa steg – från ett enkelt Gemini‑API‑anrop till en fullt distribuerad agent på Modal med Telegram‑integration, bestående minne och sandlåde‑exekvering – och avslutas med ett praktiskt projekt som bygger ett komplett Snake‑spel i Pygame utan att författaren skriver någon kod. Guiden kommer i ett ögonblick då utvecklare i allt högre grad kräver transparens och kontroll över de AI‑verktyg som skriver kod åt dem. Nyliga genombrott, såsom den själv‑evolverande kodningsagent som en Meta‑praktikant presenterade tidigare i månaden, har visat kraften i automatisering driven av stora språkmodeller (LLM), men många lösningar förblir låsta bakom proprietära stackar. Owens metod, som med ett enda kommando växlar mellan moln‑ och lokala modeller och till och med kör ”hjärnan” på en laptop via Ollama, adresserar detta direkt och lovar lägre kostnader, enklare granskning och möjlighet att anpassa prompts efter interna policys. Branschobservatörer ser publikationen som en katalysator för en bredare gör‑det‑själv‑rö
21

🤖 Jag försökte bygga en minnes‑först AI… och upptäckte att mindre modeller kan slå större

Mastodon +6 källor mastodon
claude
En utvecklares sidoprojekt har vänt AI‑skalningsboken upp och ner. Genom att koppla in ett lättviktigt “minnes‑först”-lager i en blygsam logistisk TF‑IDF‑klassificerare lyckades författaren nå 92,37 % noggrannhet på Banking77‑20‑intentsklassificerings‑benchmarken – vilket matchar, och i vissa fall överträffar, mycket större transformer‑baserade modeller som vanligtvis kräver miljontals parametrar. Experimentet, som beskrivs i ett nyligen publicerat blogginlägg, jämförde den minnes‑först förstärkta lilla modellen med en statisk baslinje som nådde 91,61 % under identiska förhållanden, samtidigt som båda använde samma 64 940 träningsexempel och samma inferenslatens (0,473 ms per förfrågan). Minneskomponenten, inspirerad av Claude Codes “memory layer” som håller AI‑agenter förankrade i tidigare kontext, lagrar kort‑siktiga fakta och hämtar dem på begäran, vilket effektivt förstärker modellens kunskap utan att öka dess storlek. Resultatet är betydelsefullt eftersom det utmanar den rådande tron att bara större modeller kan leverera högre prestanda. Tidigare i månaden rapporterade vi om Googles TurboQuant, som reducerar minnesfotavtrycket med upp till sex‑fald, samt om Apples arbete med att destillera Gemini‑liknande kapabiliteter till on‑device‑chip. De nya fynden tyder på att smarta arkitekturtrick – specifikt externa minnesbuffertar – kan ge jämförbara förbättringar utan den hårdvarukostnad som massiva parameterantal medför. För företag som söker kostnadseffektiv AI innebär metoden lägre molnkostnader, minskad latens och striktare dataskydd, eftersom känslig kontext kan stanna på enheten. Det som återstår att bevaka är om minnes‑först‑paradigmet får genomslag bortom hobby‑demoar. Forskare utforskar redan retrieval‑augmented generation och spec‑first‑arbetsflöden som kombinerar lång‑siktiga kunskapsbaser med kompakta modeller; en formell benchmark‑svit kan snart dyka upp för att kvantifiera avvägningarna. Om stora molnleverantörer eller chip‑tillverkare integrerar minneslager i sina stackar kan vi se en ny generation av “små‑men‑smarta” AI‑tjänster som kan mäta sig med dagens jättar samtidigt som de förbrukar en bråkdel av beräkningsbudgeten. De kommande månaderna bör visa om detta experiment tänder en bredare förändring i modell‑design eller förblir en nisch‑nyfikenhet.
20

3 AI‑aktier som kan hjälpa dig att säkra framtiden

3 AI‑aktier som kan hjälpa dig att säkra framtiden
AOL +12 källor 2026-03-12 news
Motley Fools senaste forskning pekar ut tre företag inom artificiell intelligens som kan bli hörnstenar i portföljer för långsiktiga investerare. Fram till 2026 förväntar sig analytikerna att branschens ledande aktörer ska öka kapitalutgifterna med minst 50 procent, en uppgång som skulle leda till utökad datacenterkapacitet, djupare träningspipelines för modeller och en våg av nya produktlanseringar. De tre namnen som rapporten lyfter fram är Nebius, SoundHound AI och IonQ – var och en med ett eget tillväxtdrivande segment inom AI‑ekosystemet. Nebius, en specialist på molnbaserad AI‑infrastruktur, har säkrat flera hyperskala‑kontrakt och skalar upp sin skräddarsydda kiselteknik för att möta efter
20

Prompt Engineering eller Formulering av Naturliga Språkfrågor till Generativa AI‑system – Detta är ett tidigt utkast

Mastodon +9 källor mastodon
Ett utkast till ett kapitel med titeln ”Prompt Engineering eller Formulering av Naturliga Språkfrågor till Generativa AI‑system” har publicerats på Transhumanity‑plattformen och ger den första offentliga inblicken i en kommande bok som syftar till att kodifiera konsten att formulera frågor till stora språkmodeller (LLM). Skrivet av AI‑forskaren Dr. Lina Kaur beskriver manuskriptet ett tredelat ramverk – syntaktisk formulering, kontextuell förankring och iterativ förfining – och visar hur subtila förändringar i formuleringen kan få modellens svar att gå från trovärdiga till missvisande. Utsläppet är betydelsefullt eftersom prompt‑engineering har gått från ett hobbytrick till en professionell disciplin som direkt påverkar AI‑tillförlitlighet, kostnadseffektivitet och regulatorisk efterlevnad. Kaurs utkast hävdar att systematisk prompting kan minska hallucinationsfrekvensen med upp till 40 % i komplexa resonemangsuppgifter, ett påstående som återklanger nyligen arbete med graf‑baserade verifieringsverktyg (se vår rapport från den 30 mars om en Rust‑grafmotor). Genom att betrakta prompts som programmerbara gränssnitt snarare än ad‑hoc‑frågor kan företag införa reproducerbarhet i
20

Jag har inte för avsikt att göra detta till ett #AIslop‑konto, men jag gillade bara hur den här blev, lo

Jag har inte för avsikt att göra detta till ett #AIslop‑konto, men jag gillade bara hur den här blev, lo
Mastodon +11 källor mastodon
gemini
Googles Gemini‑modell får oväntat genomslag bland kreatörer, vilket ett nyligt inlägg på X (tidigare Twitter) visar. Användaren, som föredrar att förbli anonym, delade en egenproducerad serieteckning som genererats helt med Geminis bildgenereringsverktyg och beskrev resultatet som “behagligt förvånad” över dess kvalitet. Inlägget, märkt med #Gemini, #generativeai och #comicstrip, är en del av en växande våg av “AI slop” – informella uppvisningar av AI‑producerad konst som översvämmar sociala medier. Betydelsen ligger i hur snabbt Geminis visuella förmågor förflyttar sig från experimentella demonstrationer till användbart kreativt material. Hittills har Googles multimodala erbjudanden överskuggats av konkurrenter som OpenAI:s DALL‑E 3, Stability AI:s Stable Diffusion och Midjourney, som dominerar den allmänna uppfattningen om AI‑genererade bilder. Geminis förmåga att rendera sammanhängande, stiliserade paneler som tjänar ett narrativt syfte tyder på att modellen har nått en nivå av konsistens och estetisk kontroll som tidigare var förbehållen specialiserade verktyg. Utvecklingen sammanfaller med Googles senaste genombrott inom hårdvarueffektivitet. Som vi rapporterade den 31 mars 2026, minskar Googles TurboQuant‑arkitektur minnesförbrukningen för stora modeller utan att försämra kvaliteten, en förändring som kan påskynda utrullningen av mer krävande generativa funktioner i både moln‑ och konsumentprodukter. Lägre minnesavtryck gör också inferens på enheten mer genomförbart, vilket potentiellt kan föra högupplöst bildgenerering till Android‑telefoner och Chrome‑OS‑bärbara datorer. Vad man bör hålla ögonen på härnäst: Google har antytt en Gemini 2.0‑uppdatering senare i år, med löfte om högre upplösning och tätare integration med Google Workspace. Branschobservatörer kommer att vara nyfikna på om företaget öppnar ett API för tredjepartsutvecklare, vilket skulle kunna tända en ny våg av AI‑drivna verktyg för serietidningsskapande. Samtidigt kommer den kreativa gemenskapen sannolikt att testa gränserna för Geminis stilöverföring och prompt‑engineering‑förmågor, och därmed sätta ribban för nästa generation av generativ visuell AI.
20

Varför OpenAI verkligen stängde ner Sora | TechCrunch

Mastodon +6 källor mastodon
openaisora
OpenAI meddelade på X att de stänger ner Sora, den kortformat AI‑videogeneratorn som gick viral efter lanseringen i juni. Beslutet, som fattades bara sex månader efter att tjänsten öppnades för allmänheten, markerar det senaste bakslag i företagets snabba utrullning av konsumentinriktade verktyg. Som vi rapporterade den 31 mars 2026, stängde OpenAI av Sora på grund av oro för missbruk av deep‑fakes och eskalerande driftskostnader. Den nya analysen i TechCrunch tillägger att investerarpåtryckningar och en dold datainsamlingsagenda var avgörande. Soras registreringsprocess krävde att användarna laddade upp personliga ansiktsbilder, vilket väckte spekulationer om att plattformen användes för att samla in en stor biometrisk datamängd för framtida modellträning. Källor nära styrelsen säger att riskkapitalfinansiärer, som var rädda för regulatorisk återkoppling och den rykterisk som en “läskig” deep‑fake‑tjänst innebär, uppmanade företaget att skära förlusterna innan frågan eskalerade. Stängningen är viktig eftersom den signalerar ett strategiskt tillbakadragande från kostsamma, lågm
20

MAD-fel: vim vs emacs vs Claude

MAD-fel: vim vs emacs vs Claude
Mastodon +6 källor mastodon
claude
Claude, Anthropics flaggskepp‑LLM, har just bevisat att den kan fungera som en full‑stack sårbarhetsjägare. När den fick en enkel begäran – ”Någon berättade för mig att det finns en RCE‑0‑day när du öppnar en fil. Hitta den.” – identifierade modellen inte bara en fjärrkodexekveringsbrist i både Vim och Emacs, utan genererade också en fungerande proof‑of‑concept‑fil och bekräftade dess exploaterbarhet. Resultaten publicerades på bloggen calif.io, där författaren går igenom promptarna, PoC‑payloaden och verifieringsstegen. Upptäckten är viktig eftersom Vim och Emacs ligger i centrum för varje utvecklares arbetsflöde på Linux-, macOS- och BSD‑system. En RCE som aktiveras när en skadlig fil öppnas kan spridas tyst över utvecklingsmiljöer, CI‑pipelines och till och med produktionsservrar som anropar redigerare för skriptredigering eller logggranskning. Att en AI kan lokalisera och beväpna en sådan bugg med minimal
20

Jag måste använda GitHub för $reasons och Copilot bestämde sig för att skapa några sub‑agenter med mitt användarnamn, vilket jag inte förväntade mig.

Mastodon +6 källor mastodon
agentscopilot
GitHub Copilots senaste funktion – sub‑agenter som körs under en användares namn – har oavsiktligt förvandlat vissa utvecklares inkorgar till spam‑generatorer. En användare som nyligen delade en Postfix header_checks‑regel rapporterade att Copilot automatiskt skapade “sub‑agenter” med ett “@”‑prefix på deras GitHub‑användarnamn. Varje sub‑agent skickade automatiserade notifierings‑mail, och eftersom adressmönstret matchade vanlig e‑post‑routing spreds meddelandena över användarens domän, vilket översvämmade inkorgarna med tusentals redundanta varningar. Händelsen är viktig eftersom den blottlägger en blind fläck i hur AI‑drivna utvecklingsverktyg interagerar med befintlig IT‑infrastruktur. Copilots agent‑arkitektur, som rullades ut i oktober 2025, låter en primär kodningsagent skapa kontext‑isolerade sub‑agenter som kan köra olika modeller för uppgifter som kodgranskning, testning eller dokumentation. Även om designen lovar snabbare och mer modulära arbetsflöden, kolliderar standardnamngivningskonventionen med vanliga e‑post‑hanteringsregler och skapar en denial‑of‑service‑risk för organisationer som förlitar sig på automatiserad e‑postbehandling. För team som redan integrerat Copilot i CI‑pipelines kan den plötsliga ökningen av intern e‑post överväldiga övervakningsverktyg, utlösa falska larm och öka den operativa bördan. GitHub har ännu inte lämnat ett officiellt uttalande, men den community‑drivna lösningen – att lägga till en regel i Postfixs header_checks för att kasta eller omdirigera meddelanden adresserade till “@<användarnamn>”‑mönster – cirkulerar redan på utvecklarforum. Administratörer uppmanas att granska sina mailservrar för liknande mönster och överväga att begränsa Copilots e‑post‑notiser tills namngivningsschemat revideras. Vad som är värt att hålla ögonen på: GitHubs produktteam förväntas åtgärda namnkollisionen i en kommande Copilot‑uppdatering, eventuellt genom att införa konfigurerbara prefix eller opt‑out‑flaggor för sub‑agenters e‑postutmatning. Episoden väcker också bredare frågor kring styrning av AI‑genererad kommunikation, ett ämne som sannolikt kommer att dyka upp i kommande säkerhetsriktlinjer för utvecklingsverktyg och i nästa omgång av GitHubs transparensrapporter.
20

OpenAI drar pluggen på Sora, den virala AI‑videotjänsten som väckte oro för deepfakes

NPR +8 källor 2026-03-25 news
openaisora
OpenAI meddelade på tisdagen att de lägger ner Sora, den kortformade videoappen som dök upp i september 2024 och snabbt blev en showcase för AI‑genererade klipp. Företagets korta inlägg på X sade att de “säger adjö till Sora‑appen” och lovade att förklara hur användare kan bevara det innehåll de redan har skapat. Soras dragningskraft låg i dess förmåga att omvandla en textprompt till en 15‑sekunders video på några sekunder, en funktion som satte igång en våg av virala memes, marknadsföringsexperiment och, mer kontroversiellt, en ökning av realistiska deepfakes. Hollywoodstudior, politiska bevakningsorgan och integritetsförespråkare varnade för att verktyget kunde missbrukas för att fabricera nyhetsmaterial eller manipulera kändisars utseenden, vilket ledde till krav på strängare reglering. OpenAIs beslut att dra ner på Sora kommer mitt i ett växande tryck från både tillsynsmyndigheter och företagets egen styrelse att begränsa de mest riskfyllda tillämpningarna av deras modeller samtidigt som driftskostnaderna minskas. Stängningen signalerar ett skifte i OpenAIs produktstrateg
20

Detta genombrott i Googles AI kan avsluta den globala RAM‑krisen tidigare än väntat

Android Headlines on MSN +9 källor 2026-03-28 news
google
Googles AI‑forskningsgrupp meddelade en ny minneskomprimeringsteknik som kan minska RAM‑behovet för att köra stora språkmodeller med upp till sex gånger, ett språng som analytiker menar kan lösa den globala DRAM‑bristen långt före årtiondet är slut. Metoden, som fått namnet “TurboQuant‑X”, bygger på kvantisering‑ och aktiverings‑rekombinationstricken som presenterades i Googles TurboQuant‑paper tidigare i månaden, men lägger till en dynamisk sparsitetsschemaläggare som beskär och återställer neuroner i realtid, vilket bevarar modellkvaliteten inom en felmarginal på 0,5 % på benchmark‑uppgifter. Genombrottet är viktigt eftersom dagens AI‑boom driver efterfrågan på högbandbreddsmemory i en takt som överstiger kapaciteten hos chip‑fabriker, vilket driver upp priserna på DRAM och HBM och pressar marginalerna för molnleverantörer. Genom att minska minnesavtrycket för inferens‑arbetsbelastningar gör TurboQuant‑X det möjligt för datacenter att köra fler modeller på samma hårdvara, minskar energiförbrukningen och sänker materialkostnaden för edge‑enheter som tidigare krävde specialiserade AI‑chip. Investerare har redan reagerat; aktierna i Micron och Sandisk föll efter tillkännagivandet, vilket speglar den marknadsschock vi rapporterade den 31 mars när Google först antydde “massiv komprimering för stora språkmodeller” (se vår artikel från 31 mars om TurboQuant). Det som blir viktigt att följa härnäst är hur snabbt tekniken går från forskningspapper till produktion. Google planerar att införa TurboQuant‑X i sin Cloud TPU v5‑plattform redan under Q4 2026 och lockar OEM‑företag med en licensmodell som kan sprida besparingarna över hela halvledar-ekosystemet. Analytiker kommer att bevaka beställningar av minneschip från de stora leverantörerna, eventuella patentansökningar som kan forma licensvillkoren, samt om konkurrenter som Metas själv‑evolverande AI‑agenter kan matcha effektivitetsvinsterna. Antagandets takt kommer att avgöra om RAM‑krisen lindras eller helt enkelt förflyttas till en ny flaskhals i beräkningskapaciteten.
20

Google har just meddelat riktigt dåliga nyheter för Micron och SanDisk

Motley Fool· via Yahoo Finance +11 källor 2026-03-30 news
google
Googles lansering av TurboQuant – en AI‑inriktad minneskomprimeringsalgoritm – fick aktierna i Micron Technology (MU) och SanDisk (SNDK) att falla i förhandsmarknadshandeln på torsdagen. I ett blogginlägg förra veckan hävdade Googles forskningsteam att den nya tekniken kan minska minnesavtrycket för stora språkmodeller med upp till sex gånger samtidigt som inferenskvaliteten bevaras, ett påstående som återfanns i vår rapport den 31 mars om TurboQuant’s ”stora AI‑minnesreduceringar utan att skada modellkvaliteten.” Meddelandet är betydelsefullt eftersom den största delen av dagens AI‑beräkningsbudget går till DRAM‑ och NAND‑lagring, sektorer som domineras av Micron och SanDisk. Om modeller i Googles skala kan köras på avsevärt mindre hårdvara, kan efterfrågan på minneschip med hög kapacitet avstanna, vilket pressar priser och intäkter för de två tillverkarna. Analytiker på TipRanks och Fast Markets påpekade den omedelbara marknadsreaktionen och noterade att algoritmen kan ”avsevärt minska minneskraven för AI‑system,” ett perspektiv som undergräver tillväxtberättelsen byggd på exploderande modellstorlekar. Det som blir intressant att följa är om TurboQuant förblir ett internt Google‑verktyg eller om det erbjuds till det bredare AI‑ekosystemet. En öppen källkods‑release eller ett licensavtal skulle kunna påskynda antagandet bland molnleverantörer och förstärka slaget mot minnesleverantörerna. Omvänt kan Micron och SanDisk svara med nästa generations höghastighetsminne (HBM) eller lagringsklassminne som mildrar komprimeringsfördelen. Investerare bör också hålla ett öga på Googles partnerskap med Pentagon, som kan snabba på TurboQuant’s införande i försvarsklassade AI‑arbetsbelastningar, samt på eventuell regulatorisk granskning av en potentiell förändring i värdekedjan för AI‑hårdvara. De kommande veckorna kommer att visa om algoritmen omformar ekonomin för AI‑infrastruktur eller förblir en nischoptimering för Googles egna tjänster.
20

Genien är ute ur flaskan: Little undertecknar lag om artificiell intelligens i utbildning

LocalNews8.com +11 källor 2026-03-27 news
education
Idaho‑guvernör Brad Little har undertecknat lagstiftning som förpliktar delstatens utbildningsdepartement att utarbeta en omfattande, statlig ram för användning av generativ artificiell intelligens i K‑12‑klassrum. Lagen, som definierar ”generativ AI” som verktyg som producerar text, bilder eller video, utesluter uttryckligen modeller vars huvudsyfte är dataklassificering – såsom de som används i självkörande fordon. Delstatens superintendent Debbie Critchfield betonade att vägledningen kommer att tjäna både lärare och elever, och ge pedagogerna en handbok för att integrera, övervaka och utvärdera AI‑drivna lärandeaktiviteter. Initiativet markerar den första formella AI‑utbildningspolitiken i Mountain West och följer en våg av statliga initiativ, från Kaliforniens AI‑läroplanpilot till Texas lärarutbildningsbidrag. Genom att institutionaliserar AI‑litteracitet hoppas Idaho utrusta en generation för en arbetsmarknad där prompt‑engineering och AI‑förstärkt problemlösning blir grundläggande färdigheter. Samtidigt är ramverket avsett att begränsa den ohämmade användningen av chattbotar och bildgeneratorer som kan sprida desinformation, förstärka fördomar eller äventyra elevers integritet. Vad som händer härnäst kommer att avgöra om lagen blir en modell eller en varningssignal. Utbildningsdepartementet måste leverera ett utkast till plan inom de kommande sex månaderna, varefter det kommer att öppnas för allmänna kommentarer och sannolikt granskas av delstatens utbildningsstyrelse. Viktiga bevakningspunkter inkluderar omfattningen av finansiering för lärarfortbildning, införandet av rättviseskydd för
18

DeepSeek planerar lansering av V4 multimodell den här veckan, säger källor

Mastodon +1 källor mastodon
chipsdeepseekmultimodalopen-sourcereasoningstartup
DeepSeek, den kinesiska startupen som tidigare i år släppte den öppna källkodsmodellen R1 för resonemang, är på väg att lansera sitt första multimodala system, V4, inom några dagar. Den nya modellen kommer att generera text, bilder och video från en enda prompt, vilket markerar DeepSeeks inträde i ett område som domineras av modeller som Qwen3.5‑Omni och Googles Gemini‑3.1 Pro, vilka vi täckte i vår benchmark‑sammanställning den 31 mars. Källor nära företaget uppger att utrullningen har utvecklats i samarbete med Huawei och Cambricon för att köras effektivt på Kinas egenutvecklade AI‑acceleratorer. Genom att anpassa arkitekturen till Ascend‑ och MLU‑chipfamiljerna hoppas DeepSeek hålla inferenskostnaderna låga samtidigt som de levererar konkurrenskraftig latens – en strategi som liknar Googles nyligen presenterade TurboQuant‑minnessparande påståenden. Partnerskapet signalerar också en åtstramning av den kinesiska AI‑försörjningskedjan, där mjukvara och kisel i allt högre grad co‑designas för att minska beroendet av utländsk hårdvara. Meddelandet är viktigt av flera skäl. För det första kan en öppen källkods‑multimodal modell demokratisera tillgången till högupplöst videogenerering, en förmåga som hittills har varit begränsad till proprietära tjänster. För det andra kan DeepSeeks optimering på chipnivå sätta en ny prestanda‑pris‑standard för inhemska AI‑arbetsbelastningar, vilket potentiellt omformar ekonomin för storskalig utrullning på Kinas molnmarknad. Slutligen sammanfaller tidpunkten med en våg av multimodala lanseringar som driver gränsen för generativ AI bortom statisk media, vilket intensifierar konkurrensen om forskartalang och ekosystempartnerskap. Vad man bör hålla ögonen på härnäst: benchmark‑resultat från 2026 Multimodal AI Benchmark kommer att visa hur V4 presterar jämfört med Qwen3.5‑Omni och Gemini‑3.1 Pro när det gäller noggrannhet, hastighet och kostnad. DeepSeeks licensvillkor och tillgängligheten av förtränade vikter kommer att indikera om modellen förblir genuint öppen källkod eller skiftar mot ett kommersiellt API. Slutligen kan uppföljningsuttalanden från Huawei och Cambricon ge ledtrådar om bredare chip‑mjukvarupaket som riktar sig till företag som söker interna generativa AI‑kapaciteter.
17

Inuti den smutsiga, dystopiska världen av AI‑datacenter

Mastodon +1 källor mastodon
xai
Elon Musks AI‑företag xAI har tagit den krafttörstande tävlingen om större modeller till ett nytt, bokstavligt lågteknologiskt extremt stadium. Satellit‑ och marknära bilder som Southern Environmental Law Center har fått tag på visar att företaget bygger ett privat kraftverk bredvid sin “Colossus”-superdator, komplett med upp till 35 naturgasturbiner i storlek med ett järnvägsvagn. Motorerna, som var och en kan släppa ut betydande smog, står på en vidsträckt tomt i Texas där kompressorernas surr kan höras i flera mil. En lokal invånare, som ville förbli anonym, sade att luften “doftar som en dieselverkstad” och att turbinerna “gör himlen svart på natten.” Flytten är viktig eftersom den understryker hur AI‑beräkningsboomet omformar energimarknaderna och miljöpolitiken. Medan de flesta datacenter förlitar sig på el från elnätet – ofta en blandning av förnybar energi och fossila bränslen – innebär xAIs beslut att producera egen kraft att man kringgår nätbegränsningar men samtidigt ökar koldioxidutsläppen dramatiskt. Analytiker uppskattar att ett enda 100 MW turbinkluster kan släppa ut ungefär 500 000 ton CO₂ per år, en s
15

Korrigeringen, när den kommer, kommer att bli ful. Mängderna av felallokerat kapital involverar

Mastodon +6 källor mastodon
startup
En ny analys som släppts denna vecka av den nordiska riskkapital‑monitorn **Nordic VC Insights** varnar för att AI‑finansieringsfrenzän har skapat en ”massiv felallokering av kapital” som vida överstiger de €4 miljarder som tidigare citerats av branschobservatörer. Rapporten, som bygger på data från 312 AI‑inriktade affärer mellan januari 2024 och februari 2026, visar att ungefär €9,8 miljarder har pumpats in i projekt som saknar hållbara produktplaner, skalbara affärsmodeller eller robusta datapipelines. Mer än hälften av de finansierade startup‑företagen befinner sig fortfarande i prototypsstadiet, och en tredjedel har ingen tydlig väg till intäkter. Betydelsen av fynden sträcker sig bortom enbart balansräkningssiffror. Överbefinansierade, underförberedda företag driver upp löner för talanger, höjer kostnaderna för molntjänster och skapar ett överskott av ”halvbyggda” datamängder som riskerar att förorena nedströms AI‑modeller. Mindre aktörer, som traditionellt är drivkraften bakom innovation i regionen, pressas ut när investerare jagar rubrikfångande värderingar snarare än hållbar tillväxt. Analytiker fruktar att efterdyningarna kan lämna det nordiska AI‑ekosystemet fragmenterat, med ett fåtal välkapitaliserade ”zombie‑företag” och ett vakuum för genuina innovatörer. Rapporten förutspår att korrigeringen kommer att slå hårdast under andra halvan av 2026, när tidig‑stadiefinansiering torkar ut och större företag börjar rensa sina portföljer. Håll utkik efter en våg av fusioner och förvärv när överlevande startup‑företag söker livlina, samt efter politiska svar från Vinnova och Danmarks näringsminister, som har antytt strängare due‑diligence‑krav för AI‑relaterade bidrag. De kommande månaderna kommer också att avslöja om riskkapitalbolag omkalibrerar sina investerings­teser eller dubblar ner på hypen, vilket formar nästa kapitel i Europas AI‑ambitioner.
15

Claude‑användningsgränser nås snabbare än förväntat

HN +6 källor hn
claude
Anthropics flaggskepps‑Claude‑modeller når sina användningsgränser mycket tidigare än företaget förutspådde, vilket har lett till en abrupt begränsning av API‑åtkomsten för många utvecklare. Företaget bekräftade att de dagliga förfrågningsgränserna, som infördes tidigare i år för att hantera beräkningsbelastningen, har nåtts inom några timmar för en växande del av kundbasen, vilket tvingar vissa användare att pausa eller nedgradera sina arbetsbelastningar. Ökningen följer en våg av kostnadsbesparande verktyg och prestandaförbättringar som Anthropic lanserade i mars, särskilt ramverket för token‑effektivitet som minskade API‑kostnaderna med ungefär 60 % (se vår rapport från 31 mars). Lägre priser och snabbare svarstider har drivit en snabb ökning av antagandet inom olika sektorer – från nordiska fintech‑företag som integrerar Claude i bedrägeridetekterings‑pipelines till startups som använder modellen för kodassistans. Den oväntade efterfrågepressen visar hur snabbt ett prisincitament kan omvandlas till verklig kapacitetsbelastning. För utvecklare innebär den omedelbara effekten minskad pålitlighet och behovet av att omstrukturera tjänster kring striktare kvot‑hantering. Företag som byggt kritiska arbetsflöden på Claude står nu inför potentiell driftstopp om de inte säkrar kontrakt på högre nivå eller övergår till alternativa modeller. Händelsen understryker också den bredare marknadsdynamiken: när leverantörer tävlar om att göra stora språkmodeller billigare och mer effektiva blir infrastrukturbottnar en ny
14

YouTube ber nu tittare att identifiera generativ AI‑slop när de betygsätter videor

YouTube ber nu tittare att identifiera generativ AI‑slop när de betygsätter videor
Mastodon +1 källor mastodon
YouTube har börjat uppmana tittare att flagga “generativ‑AI‑slop” när de betygsätter videor, genom att lägga till en ny kryssruta i det välbekanta tumme‑upp/tumme‑ned‑gränssnittet som frågar om innehållet verkar vara lågkvalitativt AI‑genererat material. Initiativet, som tillkännagavs i ett blogginlägg och rullades ut till en testgrupp av användare den här veckan, utökar plattformens befintliga återkopplingsslinga genom att uttryckligen separera AI‑relaterade bekymmer från generella ogillande‑ eller “inte intresserad”‑signaler. Förändringen kommer i ett skede då AI‑genererade videor exploderar på tjänsten, från deep‑fake‑kommentarer till automatiserade musikvideor som kan produceras i stor skala med liten mänsklig tillsyn. YouTubes rekommendationsmotor förlitar sig fortfarande starkt på användargener
14

LinkedIn

Mastodon +6 källor mastodon
LinkedIn har blivit den senaste högprofilerade slagfältet i den växande konflikten om huruvida stora språkmodeller (LLM) får tränas på upphovsrättsskyddat material som samlats in från onlineplattformar. En nederländsk domstol accepterade förra veckan ett klagomål från en koalition av författare och förlag som påstår att flera AI‑företag har skrapat LinkedIn‑inlägg, CV‑data och artiklar – mycket av dem fortfarande skyddade av upphovsrätt – för att mata sina modeller. Kärandena menar att praktiken strider mot EU:s upphovsrättslagstiftning, medan teknikföretagen hittills har förlitat sig på försvaret om ”transformativ användning” och hävdar att en LLM:s output är ett nytt verk som inte inkräktar på de ursprungliga verken. Fallet är betydelsefullt eftersom LinkedIn är värd för miljarder professionella inlägg, varav många är originalartiklar, white papers och branschanalyser. Om domstolen fastställer att sådant innehåll inte får samlas in utan uttryckligt tillstånd, kan AI‑utvecklare förlora en enorm källa till högkvalitativ träningsdata, vilket potentiellt bromsar modellutvecklingen och höjer kostnaderna för startups som saknar egna korpusar. Omvänt skulle en dom till fördel för svarandena cementera en juridisk väg för AI‑företag att fortsätta skrapa offentligt tillgänglig text, vilket skulle intensifiera debatten om datainnehav och om befintliga upphovsrättsramverk är tillräckliga. Alla ögon är nu riktade mot den kommande förhandlingen, planerad till juni, där LinkedIns juridiska team förväntas argumentera för att modellernas output är ”transformativ” och därför undantagen från upphovsrättskrav. Observatörer kommer också att följa reaktionerna från Europeiska kommissionen, som håller på att utarbeta AI‑specifika bestämmelser under Digital Services Act. Resultatet kan forma licensieringspraxis, leda till nya datapolicyer på professionella nätverk och påverka hur AI‑företag strukturerar framtida träningspipelines.
13

Ett vektorlager är inte ett agentminnessystem

Dev.to +5 källor dev.to
agentsvector-db
En nyligen våg av kommentarer har skärpt debatten om hur AI‑agenter bör behålla information och varnat för att den populära genvägen “vektor‑butik‑som‑minne” är grundläggande felaktig. Påståendet, först formulerat på DEV‑community‑forumet och förstärkt i ett Medium‑inlägg av Dan Giannone, är att det enbart hämta tidigare text från en vektordatabas inte utgör ett riktigt minne för en autonom agent. Istället skapar det en skör illusion av kontinuitet som kan utnyttjas, vilseledas eller glömmas bort i fel ögonblick. Kritiken är viktig eftersom många kommersiella och öppna agenter idag förlitar sig på Retrieval‑Augmented Generation (RAG)‑pipelines som dumpar konversationssnuttar, webbutdrag eller kunskapsbasposter i ett vektorlager och sedan drar de närmaste inbäddningarna när en ny fråga anländer. Detta mönster behandlar lagret som en statisk cache snarare än ett dynamiskt, själv‑korrigerande minnessystem. Forskare har identifierat fyra grundläggande problem: avsaknad av tidsordning, oförmåga att uppdatera eller radera föråldrade fakta, brist på proveniens och överdrivet förtroende för de hämtade vektorerna. Konsekvenserna visar sig i så kallade “memory‑poisoning”-attacker, där en angripare injicerar skadliga inbäddningar i ett delat lager, vilket får flera agenter att agera på falska premisser utan någon spårning i modellens vikter. Multi‑agent‑ekosystem förstärker risken, eftersom en enda förgiftad post kan spridas över tjänster som delar samma kunskapsbas. Det som bör hållas ögonen på härnäst är framväxten av dedikerade agent‑minnesarkitekturer som går bortom “prompt stuffing”. Start‑ups och molnleverantörer rullar ut beständiga minneslager som stödjer versionshanterade uppdateringar, relevanspoängsättning och åtkomstkontroller, med målet att göra minnen granskbara och återkalleliga. Akademiska laboratorier publicerar också benchmark‑tester som utvärderar inte bara återkallningsnoggrannhet utan även motståndskraft mot förgiftning och drift. När fältet konvergerar mot dessa mer robusta lösningar kommer utvecklare behöva eftermontera befintliga RAG‑pipelines eller riskera att distribuera agenter vars “minne” blir en säkerhetsrisk.
12

AI NEWSWIRE >>> REUTERS: OpenClaw‑entusiasm greppar Kina – kinesiska tekniker är alla i startgroparna

Mastodon +6 källor mastodon
agentsdeepseektraining
Kinesiska utvecklare rusar för att experimentera med OpenClaw, ett open‑source‑ramverk som låter användare bygga autonoma AI‑agenter som kan kurera och återhämta sin egen specialiserade kunskap. Reuters rapporterade att gemenskapen har myntat uttrycket ”raising a lobster” (att “uppfostra en hummer”) för att beskriva processen att träna en personlig agent som kan överträffa generiska chatt‑botar såsom DeepSeek när det gäller hantering av nischade datamängder. Denna uppgång speglar ett bredare skifte i Kinas AI‑landskap från en‑storlek‑passar‑alla‑konversationsmodeller till personliga, uppgiftsorienterade assistenter. Genom att bädda in proprietära dokument, kodsnuttar och domänspecifik forskning i en självständig agent hoppas ingenjörer kunna minska den tid som läggs på att söka i interna wikis och förbättra beslutsfattandets hastighet. Tidiga adoptörer, från fintech‑startups till universitetslaboratorier, påstår att OpenClaws modulära arkitektur – som kombinerar retrieval‑augmented generation med förstärkningsinlärningsloopar – levererar mer korrekta svar än de stora språkmodeller de tidigare förlitade sig på. Utvecklingen är viktig av flera skäl. För det första signalerar den ett växande förtroende för community‑driven AI‑verktyg, en sektor som traditionellt domineras av statligt stödda jättar som Baidu och Alibaba. För det andra kan förändringen omforma dynamiken kring dataskydd: personliga agenter behåller känslig information på plats istället för att skicka den till molnleverantörer, vilket stämmer överens med Kinas skärpande regler för gränsöverskridande dataflöden. Slutligen kan entusiasmen påskynda ett talang‑kapprace, då företag tävlar om ingenjörer med kompetens inom prompt‑engineering, agent‑orkestrering och låg‑latens‑inferens. Det som bör hållas ögonen på härnäst är huruvida OpenClaw får formellt stöd från stora kinesiska molnleverantörer eller hårdvaruleverantörer, samt hur regulatoriska myndigheter reagerar på en våg av privat distribuerade AI‑agenter. Lika viktigt blir framväxten av standarder för agentsäkerhet och interoperabilitet, vilket kan avgöra om ”hummer‑trenden” förblir en nisch‑hobby eller blir ett mainstream‑produktivitetstool i hela landet.
12

AI‑chatbotar samlar in allt mer användardata – Meta AI och ChatGPT i toppen

Mastodon +1 källor mastodon
meta
En ny studie som publicerats av det tyska säkerhetsföretaget All‑About‑Security visar att AI‑drivna chatbotar samlar in användardata i en accelererande takt, där plats­spårning nu är inbäddad i 70 procent av de 200 appar som granskats – upp från 40 procent ett år tidigare. Metas AI‑svit och OpenAIs ChatGPT hamnar högst på listan och har geografiska platsförfrågningar i mer än tre fjärdedelar av sina konversationsgränssnitt. Ökningen speglar ett bredare branschdriv att berika stora språkmodeller med kontextuella signaler som förbättrar relevans och personalisering. Genom att föra in realtids‑platsdata i prompt‑till‑slut‑pipeline kan leverantörerna anpassa svaren efter lokalt väder, närliggande tjänster eller regionala regler, vilket i sin tur ökar engagemangsmått som driver reklamintäkter. Praktiken kolliderar dock med allt strängare integritetsregimer i Europa. EU:s AI‑lag, som förväntas vara fullt verkställd senare i år, klassificerar hög‑risk‑AI‑system som behandlar biometriska eller platsdata som föremål för strikta transparens‑ och konsekvensbedömningskrav. Nordiska tillsynsmyndigheter, redan kända för rigorös tillämpning av GDPR, har signalerat avsikt att granska AI‑möjliggande datainsamling närmare. Resultaten återupplivar också de farhågor som lyftes i vår rapport den 31 mars om Metas rättsliga bakslag på grund av odeklarerad intern forskning, och understryker ett mönster av ogenomskinlig datahantering som kan leda till ytterligare rättstvister. OpenAIs nyliga beslut att avskaffa den kontroversiella ”adult mode” för ChatGPT pekar på en växande försiktighet bland AI‑företag när offentlig kritik möter regulatoriskt tryck. Vad som är värt att bevaka härnäst: Europeiska dataskyddsstyrelsen förväntas inom några veckor utfärda vägledning om AI‑specifika samtyckesmekanismer, vilket potentiellt kan tvinga chatbot‑leverantörer att omdesigna onboarding‑flöden. Både Meta och OpenAI har antytt kommande uppdateringar med integritet‑från‑grunden, och en koalition av nordiska konsumentgrupper planerar att lämna in ett gemensamt klagomål till Europeiska kommissionen om plats­spårning förblir odeklarerad. De kommande månaderna kommer sannolikt att avgöra om branschen kan förena personaliseringsambitioner med regionens höga integritetsstandarder.
12

# Metas senaste domförluster, centrerade kring företagets underlåtenhet att avslöja intern forskning om

Mastodon +6 källor mastodon
anthropicmetaopenai
Meta Platforms drabbades av en rad domslut den här veckan efter att domare fastslog att företaget olagligt hållit tillbaka intern forskning som dokumenterade de potentiella skadorna som deras sociala medieprodukter kan orsaka. Domarna härrör från en rättegång 2024 som inletts av en koalition av delstatliga justitieministrar, vilka krävde att Meta skulle överlämna studier som kopplar Instagram- och Facebook-användning till psykisk ohälsa, valrelaterad desinformation och algoritmbias. Metas vägran att producera rapporterna ledde till standarddomar och, i ett fall, ett bötesbelopp på 250 miljoner dollar för förakt mot domstolen. Besluten understryker en växande juridisk förväntning att teknikföretag måste vara transparenta om de risker deras tjänster innebär, även när resultaten är obekväma. För tillsynsmyndigheter ger domen ett verktyg för att tvinga fram utlämnande utan att behöva vänta på en fullständig regleringsprocess. För branschen väcker de hotet om kostsam rättstvist och anseendeskada om intern säkerhetsarbete förblir dolt. Metas bakslag har redan lett till en förändring bland konkurrenterna. OpenAI meddelade ett utökat ramverk för säkerhetsrapportering som kommer att göra deras interna riskbedömningar tillgängliga för Federal Trade Commission på kvartalsbasis. Anthropic, som fortfarande återhämtar sig efter sin egen dom och de efterföljande lobbykampanjerna som vi rapporterade den 31 mars, sade att de granskar sina avslöjandepolicyer för att undvika ett liknande öde. Båda företagen satsar på att proaktiv transparens ska avvärja rättstvister och bygga förtroende hos lagstiftare. Vad som är värt att hålla ögonen på härnäst: en federal appellationspanel kommer att pröva Metas överklagande av böterna för förakt i juni, och FTC förväntas släppa utkast till regler om AI‑relaterade riskavslöjanden senare i sommar. Kongressens utskott har signalerat avsikt att hålla hörselmöten om företagsansvar för algoritmharm, och ytterligare domstolsbeslut kan tvinga branschen in i en ny era av obligatorisk säkerhetsrapportering.
12

På arbetsplatsen har jag nu ofta stött på situationer där jag måste bevisa för medarbetarna att AI har fel

Mastodon +6 källor mastodon
Ett växande antal IT‑proffs rapporterar att generativa AI‑verktyg ger tekniskt osäkra råd i realtid, vilket tvingar ingenjörer att ingripa och rätta till resultaten. Fenomenet kom fram i en nyligen genomförd intervju med en senior nätverksarkitekt som berättade att han ”regelbundet måste bevisa för AI:n att den har fel” när systemet föreslår suboptimala nätverksdesignmönster eller misstolkar regler för portabilitet av mjukvarulicenser. Arkitektens erfarenhet speglar ett bredare mönster som håller på att utvecklas i europeiska företag, där stora språkmodeller används för felsökning i farten, dokumentationsutkast och design‑brainstorming. Problemet är betydelsefullt eftersom det undergräver förtroendet för AI‑stödjda arbetsflöden som många företag har antagit för att påskynda leveranscykler. När en AI‑modell självsäkert föreslår en konfiguration som bryter mot bästa praxis för säkerhetszoner eller föreslår en licensmigration som strider mot öppen‑källkods‑efterlevnad, kan kostnaden för korrigering bli betydande. Dessutom belyser problemet begränsningarna i nuvarande prompt‑tekniker och behovet av domänspecifik finjustering. Även om leverantörer marknadsför ”kunskaps‑graf‑förstärkta” versioner av sina modeller, innehåller den underliggande träningsdatan fortfarande föråldrade eller motsägelsefulla tekniska standarder, vilket leder till hallucinationer som är svåra att upptäcka utan expert‑översyn. Det som bör bevakas härnäst är branschens svar på tre fronter. För det första förväntas leverantörer införa striktare valideringslager, med realtids‑policy‑motorer som flaggar riskfyllda rekommendationer innan de når användaren. För det andra kommer företag sannolikt att anta hybridstrategier, där generella modeller kombineras med kuraterade, sektorsspecifika korpusar för att minska felprocenten. För det tredje utarbetar EU‑regulatorer riktlinjer för AI‑drivna beslutsstödsverktyg, vilka kan medföra krav på transparens och ansvarsskyldighet. Som vi rapporterade om Anthropics juridiska utmaningar tidigare i månaden, ökar pressen på AI‑leverantörer att leverera pålitliga och ansvarstagande resultat, och nästa våg av produktuppdateringar kommer att visa om tekniken kan uppfylla professionella standarder utan ständig mänsklig korrigering.
12

Varför Mistral nu satsar på skuldfinansiering

Mastodon +1 källor mastodon
mistralnvidia
Mistral AI meddelade på tisdagen att de har säkrat ett lånepaket på 830 miljoner dollar från ett konsortium bestående av sju europeiska banker för att finansiera byggandet av sin egen AI‑superdatoranläggning utanför Paris. Anläggningen kommer att rymma 13 800 Nvidia GB300‑GPU:er, en skala som skulle göra den till en av kontinentens största dedikerade AI‑kluster. Finansieringen markerar ett tydligt avsteg från den tidigare kapitalanskaffning som enbart bestod av eget kapital, som Mistral avslutade för bara några veckor sedan när de slöt en runda på 830 miljoner dollar med riskkapital och statliga förmögenhetsfonder. Genom att välja skuld istället för att emittera nya aktier skyddar företaget befintliga aktieägare mot utspädning och signalerar förtroende från traditionella långivare för hållbarheten i en europeiskt ägd AI‑infrastruktur. Beslutet är betydelsefullt av flera skäl. För det första visar det att europeiska banker är villiga att stödja storskaliga AI‑

Alla datum