AI News

974

OpenAI stödjer Illinoislag som skulle begränsa när AI‑laboratorier kan hållas ansvariga

OpenAI stödjer Illinoislag som skulle begränsa när AI‑laboratorier kan hållas ansvariga
HN +18 källor hn
openai
OpenAI har formellt stött ett förslag i Illinois som kraftigt skulle begränsa de omständigheter under vilka laboratorier för artificiell intelligens kan stämmas för ”kritisk skada”. Företaget vittnade inför delstatens senat på tisdagen och hävdade att lagstiftningen – som för närvarande behandlas i kommittén – bör skydda utvecklare från ansvar även när deras modeller används för att orsaka massiva dödsfall eller förluster på miljarder dollar. Förslaget definierar kritisk skada som död eller allvarlig skada för minst 100 personer, eller ekonomisk skada på 1 miljard dollar eller mer, och skulle hindra kärande från att stämma AI‑laboratorier om de inte kan bevisa att utvecklaren medvetet möjliggjorde den specifika missbruket. OpenAIs vittnesmål återgav företagets tidigare ståndpunkt, som noterades i vår rapport den 10 april om ett liknande federalt förslag, och betonade att det nuvarande rättsliga ramverket ”inte skiljer mellan verktyget och användaren”, vilket riskerar oändliga rättstvister som kan kväva innovation. Branschobservatörer menar att åtgärden kan bli en de‑facto‑standard för AI‑ansvar i USA, särskilt eftersom andra delstater följer Illinois experiment. Kritiker varnar för att skyddet kan lämna offer utan möjlighet till rättelse och kan uppmuntra illvilliga aktörer att beväpna generativa modeller. Konsumentorganisationer har redan lovat att utmana förslaget om det antas, med hänvisning till oro för ansvarstagande och allmän säkerhet. Att hålla ögonen på framöver: Illinois senatens omröstning om förslaget, som troligen kommer att äga rum inom de närmaste veckorna; eventuell motlagstiftning på federal nivå, där lagstiftare redan debatterar bredare AI‑
223

OpenAI lägger Stargate UK på is, skyller på energikostnader och byråkrati

OpenAI lägger Stargate UK på is, skyller på energikostnader och byråkrati
HN +6 källor hn
openairegulation
OpenAI har lagt sitt Stargate UK‑datacentersprojekt på is och hänvisar till skenande energipriser och en “betydande regulatorisk börda” som de två hindren som gör satsningen oekonomisk i nuläget. Företaget meddelade pausen i ett uttalande till The Register och bekräftade att planen – som presenterades i september förra året i samband med ett statsbesök av den tidigare amerikanske presidenten Donald Trump – endast kommer att återupptas när marknads‑ och policyförhållandena förbättras. Beslutet slår hårt mot Storbritanniens AI‑agenda. Stargate UK presenterades av den brittiska regeringen som en flaggskepps‑investering som skulle förankra landets ambition att bli en global AI‑nav och understödja ett AI‑tillväxtpaket på 31 miljarder pund. Genom att lägga projektet på hyllan tar OpenAI bort en hörnsten i den strategin, vilket äventyrar tusentals högkvalificerade jobb, lokala leverantörskontrakt och den bredare berättelsen om Storbritannien som en suverän AI‑ledare. Åtgärden understryker också sektorns sårbarhet för externa kostnadspåtryckningar; elpriserna i Europa har skjutit i höjden på grund av leveransbegränsningar, medan den EU‑UK‑regleringsmiljö som rör AI fortfarande är i förändring. OpenAIs tillbakadragande följer en rad bakslag som rapporterats tidigare i veckan, bland annat företagets återdrag från det 31 miljarder pund stora brittiska investeringspaketet och en ny prenumeration på ChatGPT för 100 dollar per månad kopplad till “Vibe”‑kodningsfunktioner. Företaget lobbar också för lagstiftning som skulle begränsa ansvar för AI‑drivna masskatastrofsituationer, och det står inför en undersökning i Florida om påstådda risker för minderåriga. Tillsammans pekar dessa händelser på en försiktig omkalibrering inför företagets förväntade börsnotering. Vad man bör hålla ögonen på härnäst: den brittiska regeringens svar, inklusive eventuella justeringar av subventioner eller regulatoriska ramverk som kan göra projektet genomförbart igen; OpenAIs tidsplan för att återuppta byggandet; samt huruvida andra AI‑företag kommer att ompröva sina infrastruktursatsningar i Storbritannien i ljuset av energikostnads‑ och regulatoriska motvindar. Resultatet kommer att forma takten med vilken Storbritannien kan locka storskaliga AI‑investeringar under de kommande åren.
150

Förstå Transformers Del 4: Introduktion till Själv‑uppmärksamhet

Förstå Transformers Del 4: Introduktion till Själv‑uppmärksamhet
Dev.to +9 källor dev.to
embeddings
Rijul Rajeshs “Understanding Transformers Part 4: Introduction to Self‑Attention” publicerades den 9 april och utvidgar hans populära serie som avmystifierar arkitekturen bakom dagens stora språkmodeller. Det nya inlägget fortsätter från del 3, där Rajesh förklarade hur ordembeddingar och positionskodningar förenar betydelse med ordning, och dyker ner i själv‑uppmärksamhetsmekanismen som låter en transformer väga varje token mot varje annan token i ett enda pass. Artikeln bryter ner matematiken bakom query‑, key‑ och value‑vektorer, illustrerar multi‑head‑attention med kodsnuttar och visar hur operationen skalar från ett fåtal token till de miljarder som bearbetas av kommersiella LLM:er. Genom att översätta abstrakta tensoroperationer till konkreta exempel ger Rajesh utvecklare ett praktiskt försprång för att bygga eller finjustera sina egna modeller – en särskilt värdefull resurs för den nordiska AI‑gemenskapen, där startups och forskningslabbar snabbt antar transformer‑baserade lösningar för allt från flerspråkiga chatbots till klimatdata‑analys. Varför det är viktigt är tvådelat. För det första är själv‑uppmärksamhet motorn som driver den kontextuella förståelse
130

OpenAI stödjer lagförslag som skulle begränsa ansvar för AI‑drivna massdödsfall eller finansiella katastrofer

OpenAI stödjer lagförslag som skulle begränsa ansvar för AI‑drivna massdödsfall eller finansiella katastrofer
Mastodon +7 källor mastodon
openai
OpenAI har lagt sitt stöd bakom ett kontroversiellt lagförslag i Illinois senat som skulle ge AI‑utvecklare ett juridiskt skydd när deras modeller används för att orsaka ”mass‑skada” – definierat som död eller allvarlig skada på minst 100 personer, eller egendomsskada på 1 miljard dollar eller mer. Beslutet, som tillkännagavs den här veckan, markerar första gången ett stort AI‑företag offentligt stöder lagstiftning som i praktiken begränsar det civila ansvaret för katastrofala följder kopplade till dess teknik. Lagförslaget, formellt kallat ”AI Liability Shield Act”, skulle undanta företag från vårdslöshetstalan såvida de inte kan bevisa att de vidtagit ”rimliga åtgärder” för att förhindra missbruk. Förespråkarna menar att utan ett sådant skydd kan företag bli förlamade av rättstvister kring händelser de inte fullt ut kan kontrollera, vilket skulle bromsa innovation inom hög‑riskområden som autonoma vapen, övervakning av kritisk infrastruktur och storskaliga generativa modeller. OpenAIs stöd signalerar en strategisk kalkyl: genom att forma lagen redan nu hoppas företaget undvika ett lapprat av statliga rättegångar som kan uppstå
127

OpenAI lägger ner banbrytande investeringspaket på 31 miljarder pund i Storbritannien

OpenAI lägger ner banbrytande investeringspaket på 31 miljarder pund i Storbritannien
Mastodon +10 källor mastodon
copyrightopenai
OpenAI har dragit i nödstoppet för sitt 31 miljarder pund stora ”Stargate UK”-program och stoppat planerna på att bygga ett enormt AI‑beräkningscenter i Cobalt i Northumberland. Företaget hänvisade till skyhöga energikostnader och en alltmer osäker regulatorisk miljö som de avgörande faktorerna bakom återtåget. Beslutet avslutar ett högprofilerat samarbete mellan Storbritannien och USA som skulle ”integrera AI” i den brittiska ekonomin, skapa tusentals högkvalificerade jobb och befästa Storbritanniens roll som ett europeiskt AI‑centrum. Investeringen skulle ha blivit den största enskilda utländska AI‑åtagandet i landets historia och komplettera OpenAIs 500 miljarder dollar stora ”Stargate”-lansering i USA. Dess avbokning berövar inte bara Nordöstra England en potentiell ekonomisk katalysator, utan signalerar också att Storbritanniens nuvarande politik och energiramverk kan vara i disharmoni med de kapitalintensiva kraven från frontier‑AI‑modeller. Som vi rapporterade den 9 april har OpenAI också lagt ett separat datacenteravtal på paus och övergått till förbrukningsbaserad prissättning för sitt Codex‑API, vilket understryker en bredare omkalibrering av deras europeiska strategi. Det senaste tillbakadragandet förstärker oron för att Storbritannien kan förlora marknadsandelar till konkurrenter som Europas DeepMind och USA, där mer förutsägbara regulatoriska vägar och billigare el redan lockar storskaliga AI‑infrastrukturprojekt. Att hålla ögonen på framöver: den brittiska regeringens svar, inklusive om den kommer att erbjuda riktade subventioner, påskynda AI‑licenser eller omförhandla avtalets villkor. Branschobservatörer
124

Inuti Anthropics projekt Glasswing: AI‑modellen som upptäckte noll‑dagars sårbarheter i alla stora operativsystem

Inuti Anthropics projekt Glasswing: AI‑modellen som upptäckte noll‑dagars sårbarheter i alla stora operativsystem
Dev.to +6 källor dev.to
anthropic
Anthropic presenterade projektet Glasswing den 7 april och släppte en ny frontlinjemodell, Claude Mythos Preview, till en utvald grupp av partners inom defensiv säkerhet. Modellen har redan identifierat tusentals noll‑dagarsfel i alla större operativsystem och webbläsare, inklusive sårbarheter som har undgått mänskliga granskare i årtionden. Lanseringspartnerna – bland dem Microsoft, Apple, Google och flera ledande molnleverantörer – kommer att integrera Mythos i sina bug‑bounty‑processer och interna testsviter, medan Anthropic lovar att publicera aggregerade resultat för hela branschen. Tillkännagivandet bygger på företagets tidigare satsning på att integrera AI i cyberförsvar, vilket vi rapporterade om den 10 april när Anthropics Claude Mythos Preview först presenterades för att stärka säkerhetsled
119

OpenAI pausar Stargate‑datacenter i Storbritannien med hänvisning till energikostnader

Bloomberg +14 källor 2026-03-25 news
openai
OpenAI meddelade idag att de pausar utrullningen av sitt ”Stargate”-projekt för artificiell intelligens i Storbritannien, med hänvisning till de kraftigt stigande energikostnaderna och ett alltmer komplext regulatoriskt landskap. Beslutet stoppar byggandet av det högpresterande datacentret som skulle hysa företagets nästa generations GPU-kluster och fungera som en knutpunkt för europeiska kunder. Steget bygger på den varning som gavs den 9 april, då OpenAI först lade sin UK‑datacenteraffär på is på grund av liknande bekymmer. Vid den tidpunkten hade företaget redan signalerat att det £31‑miljarder‑stora investeringspaket som de lovat den brittiska regeringen kunde bli hotat. Genom att pausa Stargate minskar OpenAI i praktiken sina europeiska beräkningsambitioner tills energipriserna stabiliseras och tydligare vägledning kring AI‑relaterade regleringar framkommer. Pausen är viktig av flera skäl. Storbritannien har positionerat sig som en potentiell AI‑supermakt och räknar med OpenAIs närvaro för att locka talang, driva lokala leveranskedjor och motivera offentliga subventioner för förnybar energi. Ett försenat datacenter riskerar att bromsa utrullningen av avancerade AI‑tjänster för brittiska företag och kan minska förtroendet bland andra teknikföretag som överväger
111

Jag riktade Claude Code mot mina lokala Ollama‑modeller — så här gör du på tre minuter

Jag riktade Claude Code mot mina lokala Ollama‑modeller — så här gör du på tre minuter
Dev.to +9 källor dev.to
claudegeminillama
Claude’s new “Claude Code” agent has finally been paired with locally‑hosted Ollama models, and a three‑minute guide shows how to route the tool, the Codex CLI and even Gemini’s command‑line client through a single localhost proxy. The setup requires Ollama v0.14 or newer, an “amodelfile” that defines the base model, system prompt and generation parameters, and a lightweight proxy that translates Anthropic‑compatible API calls into Ollama’s local endpoints. Once the proxy is running, developers can invoke Claude Code without an API key, switch instantly between models such as qwen3.5, GLM‑5 or Kimi‑K2.5, and keep all code and data on‑premises. The move matters because it removes the two biggest friction points of today’s AI‑assisted development: cloud cost and data leakage. By keeping inference on a laptop or edge server, teams can experiment with high‑quality code generation without incurring per‑token fees or exposing proprietary repositories. The guide also demonstrates that the same proxy can serve multiple agents, echoing the local stack we covered on April 10 (“TurboQuant on a MacBook”), where we showed how Ollama, MLX and an automatic routing layer can create a full‑stack AI environment. Together, the two pieces illustrate a growing ecosystem of open‑source glue that makes “run‑anywhere” AI development a practical reality. What to watch next is whether Anthropic expands Claude Code’s compatibility beyond its own API format, potentially embracing OpenAI‑style endpoints that would let any local model be swapped in with a single config change. Community contributors are already publishing benchmark scripts that compare latency and token quality across GPU‑accelerated and CPU‑only setups, and early signs suggest a race to optimise tool‑calling on modest hardware. If the proxy model proves stable, we may see IDE plugins and CI pipelines adopt it, turning local LLMs from a hobbyist curiosity into a mainstream development aid.
106

Anthropics Claude Mythos‑förhandsvisning stärker cybersäkerhetsledare

Mastodon +12 källor mastodon
anthropicclaude
Anthropic har öppnat sin senaste stora språkmodell, Claude Mythos, för ett fåtal ledande cybersäkerhetsföretag genom ett program som kallas Project Glasswing. Förhandsvisningen, som började rullas ut den här veckan, ger partner – bland dem Microsoft, Palo Alto Networks och ett konsortium av europeiska infrastrukturleverantörer – direkt åtkomst till en modell som Anthropic säger kan autonomt upptäcka och till och med skapa exploateringar för noll‑dagssårbarheter. Tidiga tester har redan avslöjat tusentals tidigare okända fel i allmänt använda programvarukedjor, vilket har fått företaget att skärpa modellens säkerhetsgrindar i realtid. Detta är betydelsefullt eftersom det markerar första gången en generativ‑AI‑utvecklare medvetet har hållit tillbaka ett kraftfullt, potentiellt vapeniserbart system från allmänheten samtidigt som den har överlämnats till en noggrant utvald säkerhetsgemenskap. Genom detta hoppas Anthropic omvandla en dubbelanvändningsteknologi till en defensiv tillgång och påskynda sårbarhetsforskning som annars skulle kräva månader av manuellt arbete. Initiativet signalerar också ett skifte i AI‑säkerhetslandskapet: leverantörer ser nu avancerade modeller som väsentliga verktyg för hotjakt snarare än enbart som risker att mildra. För den bredare marknaden understryker partnerskapet den växande viljan hos AI‑företag att integrera säkerhetsprotokoll och samarbeta med branschens försvarare, en hållning som står i kontrast till de mer öppna lanseringsstrategierna hos konkurrenter som OpenAI. Det som återstår att bevaka är om Anthropic kan omvandla de tidiga vinsterna till en skalbar, ansvarsfullt distribuerad tjänst. Företaget har lovat att hålla Mythos utanför den offentliga domänen tills robusta skyddsåtgärder bevisats, men investerare kommer att söka en tidsplan för ett kommersiellt erbjudande. Parallellt förväntas regulatorer i EU och USA granska de etiska implikationerna av att ge elitspelare exklusiva AI‑kapaciteter. Resultatet av Project Glasswing kan bli ett prejudikat för hur AI‑industrin balanserar innovation med nödvändigheten att förhindra missbruk.
106

OpenAI stöttar lagförslag som skulle begränsa ansvar för AI‑drivna massdödsfall eller finansiella katastrofer

OpenAI stöttar lagförslag som skulle begränsa ansvar för AI‑drivna massdödsfall eller finansiella katastrofer
Mastodon +11 källor mastodon
openai
OpenAI har lagt sitt stöd bakom ett kontroversiellt lagförslag i Illinois senaten som skulle skydda utvecklare av artificiell intelligens från civilrättsligt ansvar när deras modeller används för att orsaka ”kritiska skador” – definierade som dödsfall på 100 eller fler personer, skador på ett liknande antal eller egendomsskador som överstiger 1 miljard dollar. Företaget vittnade inför delstatens lagstiftande församling förra veckan och hävdade att den befintliga skadeståndsrätten orättvist bestraffar skaparna för efterföljande missbruk som de inte realistiskt kan kontrollera. Förslaget, känt som AI Liability Shield Act, skulle ge AI‑laboratorier ett lagstadgat försvar mot rättsliga processer för felaktig död, personskada och massiva skador, förutsatt att tekniken inte medvetet har utformats för olagliga ändamål. Förespråkarna menar att åtgärden kommer att främja innovation genom
97

OpenAI halverar ChatGPT Pro‑priset till 100 USD och siktar på Claude Code

OpenAI halverar ChatGPT Pro‑priset till 100 USD och siktar på Claude Code
Mastodon +13 källor mastodon
claudeopenai
OpenAI meddelade på tisdagen att den månatliga avgiften för sitt ChatGPT Pro‑paket har halverats till 100 USD, ett steg som tydligt riktar sig mot utvecklare som har börjat föredra Anthropics Claude Code. Den reviderade nivån erbjuder nu fem gånger högre Codex‑användningsgränser än det 20 USD‑per‑månad Plus‑paketet och inkluderar exklusiv tillgång till forskningsförhandsgranskningen GPT‑5.3‑Codex‑Spark. Prisjusteringen följer OpenAIs lansering tidigare i månaden av ett 100 USD‑per‑månad Pro‑abonnemang för tungare Codex‑användning, vilket vi rapporterade den 10 april. Vid lanseringen lovade nivån fem gånger högre gränser men paketerade också en tillfällig dubblering av kapaciteten som löper ut den 31 maj. Genom att sänka priset till 100 USD gör OpenAI i praktiken den förstärkta kapaciteten till standard, vilket minskar avståndet till Anthropics motsvarande erbjudande och signalerar att företaget ser kodningsmarknaden som ett avgörande slagfält. För utvecklare sänker förändringen tröskeln för en högpresterande kodassistent som kan generera, granska och refaktorera kod i stor skala. Den lägger också press på konkurrerande plattformar att antingen matcha prissättningen eller differentiera sig med nya funktioner, vilket potentiellt kan påskynda antagandet av AI‑drivna utvecklingsverktyg i Norden och bortom. Vad som är värt att hålla ögonen på: OpenAI har antytt att deras “av en slump” uppkomna prismodell kommer att fortsätta utvecklas, så ytterligare nivåjusteringar eller ett obegränsat åtkomstpaket kan vara på horisonten. Analytiker kommer att följa prenumerationsupptaget efter att den tillfälliga förstärkningen upphör, medan Anthropic förväntas svara med egna prisjusteringar för Claude Code. De kommande veckorna bör avslöja om 100‑USD‑Pro‑nivån omformar de konkurrensmässiga dynamikerna inom AI‑assisterad mjukvaruutveckling.
90

Gör dem dumma, sälj dem smarthet

Gör dem dumma, sälj dem smarthet
Mastodon +8 källor mastodon
OpenAI:s VD Sam Altman presenterade en djärv ny intäktsmodell på företagets ”AI Utility”-presentation den 9 april, och placerade generativ intelligens som en offentlig tjänst som faktureras på samma sätt som vatten eller el. Planen, som kallas ”Intelligence-as-a-Utility”, kommer att debitera användare för den mängd ”kognitiv bandbredd” deras frågor förbrukar, mätt i en ny enhet som kallas ”smart‑tokens”. Även om OpenAI redan tjänar pengar på ChatGPT genom prenumerationsnivåer och API‑användning, skiftar utility‑modellen fokus från fast pris till en betal‑per‑intelligens‑ram, vilket i praktiken gör varje svar, förslag eller kodsnutt till en mättad tjänst. Altman menar att modellen speglar den växande verkligheten att AI‑assistenter avlastar minne och resonemangsuppgifter från människors hjärnor. Nyliga studier från universitet i Skandinavien och USA visar att frekvent förlitelse på konversationsagenter kan försämra informationsbevarande och kritiskt tänkande, ett fenomen som Altman bekräftar i sina kommentarer. Genom att prissätta ”smarthet” direkt hoppas OpenAI kunna återfå de enorma beräkningskostnaderna för att träna allt större modeller samtidigt som de uppmuntrar till mer effektiv promptning
75

Reverse‑RAG: Bygger AI‑drivna syntetiska staging‑miljöer på AWS

Reverse‑RAG: Bygger AI‑drivna syntetiska staging‑miljöer på AWS
Dev.to +9 källor dev.to
rag
En ny AWS‑hostad arkitektur som kallas **Reverse‑RAG** vänder upp och ner på den traditionella “retrieval‑augmented generation”-modellen. Istället för att hämta extern kunskap till en språkmodell vid inferens, matar Reverse‑RAG ett modellgenererat syntetiskt arbetsbelastning tillbaka in i en staging‑miljö, vilket skapar en dynamisk, fientlig provningsplats som efterliknar verkliga edge‑case innan koden når produktion. Metoden presenterades i en teknisk guide som steg för steg visar utvecklare hur man kopplar samman Amazon Bedrock, SageMaker, Lambda och Step Functions i en återkopplingsslinga. När en CI/CD‑pipeline rapporterar grönt och enhetstesterna passerar, genererar systemet automatiskt realistiska användarförfrågningar, felaktiga indata och data‑drift‑scenarier. Dessa syntetiska interaktioner dirigeras sedan till en replika av den levande stacken
75

Avmystifiera RAG‑arkitektur för företagsdata: En teknisk plan

Avmystifiera RAG‑arkitektur för företagsdata: En teknisk plan
Dev.to +9 källor dev.to
embeddingsragvector-db
**Sammanfattning:** En ny teknisk guide med titeln **“Demystifying RAG Architecture for Enterprise Data”** har publicerats på plattformen DEV Community och presenterar en steg‑för‑steg‑plan för att bygga produktionsklara Retrieval‑Augmented Generation (RAG)‑pipelines. Artikeln leder läsaren genom systematisk datainhämtning, chunk‑indelning, generering av embeddingar, indexering i vektordatabas och förstärkning av prompts, och positionerar RAG som ett kostnadseffektivt, agilt alternativ till fullskalig modell‑finjustering för företagskunskapsbaser. Publiceringen kommer i ett ögonblick då branschen samlas kring modulära AI‑stackar. NVIDIA:s “AI Blueprint for Retrieval‑Augmented Generation” och Informaticas “RAG Data Ingestion: Enterprise Implementation” erbjuder båda referensarkitekturer som speglar samma fyrastegs‑arbetsflöde, vilket understryker en konvergerande konsensus kring bästa praxis. Genom att omvandla rå, heterogen företagsdata – dokument, relationsdatabastabeller, API‑er och händelseströmmar – till semantiskt rika embeddingar kan organisationer hålla stora språkmodeller (LLM‑er) uppdaterade med intern kunskap utan att behöva återträna dem, vilket minskar beräkningskostnaderna och förkortar tiden till affärsvärde. Varför detta är viktigt är tvådelat. För det första adresserar planen direkt de felpunkter som pekats ut i vår tidigare bevakning av RAG‑svagheter, såsom låg återhämtningsrelevans och skör prompt‑integration, genom att rekommendera högpresterande vektorlager och intelligenta chunk‑strategier. För det andra ligger den i linje med den växande efterfrågan på lokala eller hybrida AI‑distributioner som drivs av datasuveränitetsregler i Norden och Europa, och erbjuder en väg mot säkra, styrda AI‑assistenter, sökverktyg och copilot‑lösningar. Det som bör hållas ögonen på härnäst är antagandekurvorna för dessa referensdesigner i stora organisationer, särskilt inom reglerade sektorer som finans och hälso‑ och sjukvård. Leverantörer kommer sannolikt att paketera planen med hanterade tjänster, medan open‑source‑projekt kan standardisera embedding‑format och utvärderingsmått. Nästa våg av tillkännagivanden – möjligen från molnleverantörer eller standardiseringsorgan – kommer att visa om RAG blir den standardarkitektur som företag använder för GenAI eller om den förblir ett nischat komplement till finjusterade modeller.
72

USA kallar in bankchefer över cybersäkerhetsrisker från Anthropics senaste AI-modell

USA kallar in bankchefer över cybersäkerhetsrisker från Anthropics senaste AI-modell
HN +8 källor hn
anthropic
USA:s finansminister Scott Bessent och Federal Reserve‑ordförande Jerome Powell sammankallade i veckan ett akut möte med landets största bank‑VD:ar i Washington för att varna för ett ”oöverträffat” cyberriskexponering från Anthropics nyaste stora språkmodell, som fått namnet Mythos. Bland de närvarande fanns cheferna för JPMorgan Chase, Bank of America, Citigroup och Wells Fargo, som fick en genomgång av modellens förmåga att generera sofistikerad kod, automatisera sårbarhetsupptäckt och i stor skala skapa phishing‑innehåll. Varningen kommer efter Anthropics senaste demonstration av Mythos, som bygger vidare på de möjligheter som visades i deras Project Glasswing‑forskning, där man upptäckte zero‑day‑brister i flera stora operativsystem. Regleringsmyndigheterna fruktar att samma tekniker kan vapeniseras mot finansinstitut, där ett enda exploat kan sprida sig genom betalningsnätverk, handelsplattformar och kunddatabaser. Genom att samla in VD:arna signalerar Finansdepartementet och Fed att hotet inte är abstrakt utan ett potentiellt systemiskt risk som kan undergräva marknadsstabiliteten och urholka konsumentförtroendet. Vad som händer härnäst beror på hur snabbt bankerna kan stärka sina AI‑styrningsramverk. Branschobservatörer förväntar sig att Finansdepartementet ska utarbeta sektorsspecifik vägledning för modellanvändning, medan Fed kan överväga stresstester som inkluderar AI‑drivna attack‑scenarier. Anthropic har lovat att samarbeta med myndigheterna och införa ”red‑team”-säkerhetsåtgärder i framtida releaser, men takten i deras produktutveckling är fortfarande en källa till debatt. Håll utkik efter ett formellt policydokument från Finansdepartementet under de kommande veckorna, möjliga ändringar i Cybersecurity‑Information Sharing Act och eventuella offentliga svar från Anthropic som kan forma den regulatoriska landskapet för AI inom finans.
69

Omvänd ingenjörskonst av Geminis SynthID‑detektion

Omvänd ingenjörskonst av Geminis SynthID‑detektion
HN +11 källor hn
geminigooglemeta
Googles Gemini‑modell har länge förlitat sig på SynthID, ett osynligt vattenmärke som märker AI‑genererad text och bilder så att de kan identifieras av företagets SynthIDDetector‑verktyg som presenterades på Google I/O 2025. Ett team av oberoende forskare meddelade att de framgångsrikt har omvänt konstruerat detekteringsmekanismen och avslöjat de statistiska mönstren och token‑nivå‑signalerna som detektorn använder för att flagga syntetiskt innehåll. Genombrottet kom efter att forskarna samlade in ett stort korpus av Gemini‑utdata, använde den publika detektorn och sedan utförde en differentialanalys för att isolera vattenmärkets signatur. Deras artikel, publicerad på en pre‑print‑server, beskriver en uppsättning heuristiker som både kan bekräfta närvaron av SynthID och, avgörande, föreslå sätt att avlägsna eller maskera vattenmärket utan att försämra outputens kvalitet. Författarna betonar att deras arbete syftar till att granska vattenmärkningens robusthet snarare än att möjliggöra illvilligt missbruk. Varför detta är viktigt är tvåfaldigt. För det första undergräver upptäckten Googles påstående att SynthID erbjuder en manipulationssäker provenienssignal för AI‑gener
67

Finjustering av Gemma 3 med Cloud Run‑jobb: Serverlösa GPU:er (NVIDIA RTX 6000 Pro) för klassificering av husdjursraser 🐈🐕

Finjustering av Gemma 3 med Cloud Run‑jobb: Serverlösa GPU:er (NVIDIA RTX 6000 Pro) för klassificering av husdjursraser 🐈🐕
Dev.to +8 källor dev.to
fine-tuninggemmagooglenvidia
Google Cloud har lanserat serverlösa GPU‑instanser på Cloud Run, vilket gör det möjligt för utvecklare att utnyttja NVIDIA RTX 6000 Pro‑kort (Blackwell) utan att behöva provisionera dedikerade VM‑maskiner. Den nya tjänsten demonstrerades i ett proof‑of‑concept där den 27‑miljard‑parametriga Gemma 3‑modellen finjusterades för att känna igen kattraser och hundraser, och hela träningspipeline kördes som ett Cloud Run‑jobb. Arbetsflödet kombinerar Hugging Face:s Transformers‑bibliotek, TRL‑SFTTrainer och LoRA‑liknande parametrisk effektiv finjustering, allt körs på en GPU som debiteras per sekund och som skalas ner till noll när den är inaktiv. Enligt författaren till demonstrationen registrerades en kall
64

OpenAI skickade ett memo till investerare och påstod att de har 1,9 gigawatt av beräkningskapacitet jämfört med Anthropics 1,4 gigawatt

OpenAI skickade ett memo till investerare och påstod att de har 1,9 gigawatt av beräkningskapacitet jämfört med Anthropics 1,4 gigawatt
Cryptopolitan on MSN +12 källor 2026-04-08 news
anthropicmicrosoftopenai
OpenAI har avslöjat för sina investerare att de nu kontrollerar ungefär 1,9 gigawatt av AI‑beräkningskapacitet, en siffra som överträffar rivalen Anthropics rapporterade 1,4 gigawatt. Memoet, som cirkulerar samtidigt som båda företagen förbereder sig för börsnoteringar, beskriver skillnaden som en “strukturell fördel” som kan leda till snabbare modelliteration, lägre inferenskostnader och en starkare förhandlingsposition gentemot molnpartner. Påståendet är betydelsefullt eftersom beräkningskapacitet har blivit den primära skyddsmuren i tävlingen om generativ AI. Träning av toppmoderna modeller förbrukar nu megawatt i veckor i sträck, och förmågan att säkra storskalig hårdvara i förväg inför efterfrågespikar kan bestämma marknadsandelar. OpenAIs uppgång beror på ett flerårigt partnerskap med Microsoft, som har kanaliserat mer än
64

OpenAI begränsar lanseringen av nya modeller på grund av cybersäkerhetsrisker

Mastodon +7 källor mastodon
openai
OpenAI meddelade på tisdagen att de avsiktligt kommer att bromsa utrullningen av sina nästa generations språkmodeller, med hänvisning till risken att tekniken kan vapeniseras för att upptäcka mjukvarusårbarheter i stor skala. Företaget sade att de kommer att gå från en ”bred offentlig lansering” till en stegvis, enbart på inbjudan baserad utrullning för företags‑ och forskningspartner, med striktare övervakning av hur modellerna används. Beslutet följer interna debatter som speglar de långvariga ”ansvarsfulla avslöjandepraxis” som cybersäkerhetsföretag tillämpar. OpenAIs säkerhetschef, Mira Lee, liknade tillvägagångssättet vid hur leverantörer patchar kritiska buggar först efter att ha bekräftat att korrigeringar är på plats, och argumenterade att obegränsad åtkomst skulle kunna påskynda upptäckten av noll‑dagsexploater i kritisk infrastruktur. Åtgärden stämmer också överens med den senaste branschens försiktighet: Anthropic begränsade förra veckan sin egen högkapacitetsmodell, Mythos, av samma anledning, och tillsynsmyndigheter i EU och Storbritannien har börjat undersöka de samhälleliga effekterna av allt kraftfullare AI‑system. Att begränsa lanseringen är viktigt eftersom det signalerar ett skifte från OpenAIs tidigare strategi med snabb, öppen spridning mot en mer skyddad modell för kommersialisering. Restriktionen kan sakta innovationstakten för utvecklare som är beroende av de senaste funktionerna, men den kan också förhindra en våg av AI‑drivna cyberattacker som skulle kunna överträffa nuvarande försvarsverktyg. Analytiker noterar att tidpunkten sammanfaller med rapporterade brist på beräkningskapacitet hos OpenAI och den förestående pensioneringen av GPT‑4o den 3 april, vilket tyder på att företaget omfördelar resurser för att hantera risk snarare än ren skala. Att hålla utkik efter: OpenAI har lovat en detaljerad färdplan senast i slutet av månaden, som beskriver vilka partner som får tidig åtkomst och vilka övervakningsåtgärder som kommer att verkställas. Tillsynsmyndigheter förväntas utfärda vägledning om AI‑stödd sårbarhetsforskning, och konkurrenter kan antingen följa efter eller dubbla sina öppna lanseringar för att ta marknadsandelar. Balansen mellan säkerhet och hastighet kommer sannolikt att forma nästa våg av AI‑produkter i hela sektorn.
60

Nasdaq är i korrigeringsområde. Här är de två aktierna inom artificiell intelligens (AI) som jag köper först.

The Motley Fool on MSN +13 källor 2026-03-22 news
Nasdaq Composite gled in i korrigeringsområde den här veckan och föll mer än 5  % från sitt historiska toppvärde när investerare smälte ner högre‑i‑längden räntor och kvarstående geopolitisk osäkerhet. Tillbakadragandet har inte dämpat efterfrågan på artificiell‑intelligens‑lösningar; tvärtom har det rensat bort mycket av den premie som tidigare blåste upp värderingarna på AI‑inriktade infrastrukturföretag. Två aktier har framstått som de mest övertygande inträdespunkterna i detta klimat. Nvidia (NVDA) förblir motorn bakom generativ‑AI‑boomen och levererar de GPU‑er som driver allt från OpenAIs ChatGPT till företagsklassade modeller. Efter en nedgång på 15  % sedan toppnivån i mars handlas chipstillverkaren fortfarande under medianen för framåtriktade pris‑till‑vinst‑multiplar för hög‑tillväxt‑teknik, vilket lämnar analytiker som förutspår över 30  % uppsida när AI‑utgifterna accelererar. Microsoft (MSFT) är det andra valet och utnyttjar sin Azure‑molnplattform samt ett fördjupat partnerskap med OpenAI för att monetisera AI‑tjänster i stor skala. Programvarujättens aktier har fallit ungefär 10  % från de senaste topparna, vilket skapar ett värderingsgap som företagets robusta prenumerationsbas och den expanderande AI‑förstärkta Office‑sviten är redo att fylla. Betydelsen sträcker sig bortom de två namnen. AI‑infrastruktur är en sekulär tillväxtmotor som ligger till grund för en bred del av tekniksektorn, från molnleverantörer till halvledartillverkare. En korrigeringsinducerad rabatt ger därför en sällsynt möjlighet att skaffa exponering mot ett tema som analytiker förväntar sig leverera tvåsiffrig intäktstillväxt under flera år framöver. Investerare bör hålla ett öga på Nvidias kommande kvartalsrapport, där vägledningen för efterfrågan på datacenter‑tjänster kommer att testa om den senaste nedgången var en tillfällig överreaktion. Microsofts nästa kvartalsrapport kommer att visa hur snabbt Azure‑AI‑konsumtionen omvandlas till fakturerbar intäkt. Samtidigt kan förändringar i Federal Reserves politik, EU:s AI‑reglering eller konkurrensgenombrott från rivaler som AMD eller Google omforma risk‑/belöningskalkylen. För närvarande verkar marknadens korrigering handla om att köpa dippen i AI‑infrastruktur snarare än att överge trenden helt.
60

Claude Mythos: Framtiden för autonoma exploateringar – Detta är annorlunda. Anthropic gjorde inte bara b

Mastodon +9 källor mastodon
anthropicautonomousclaude
Anthropic tillkännagav existensen av Claude Mythos, en AI‑modell i förhandsvisningsstadiet som kan upptäcka noll‑dagssårbarheter autonomt i stora operativsystem och webbläsare. Företaget uppger att systemet fungerar, men att det inte kommer att släppas till allmänheten eftersom det har passerat en säkerhetströskel som Anthropic anser att branschen ännu inte är beredd att hantera. Avslöjandet markerar ett tydligt avsteg från Anthropics senaste utrullningsstrategi, som har fokuserat på inkrementella uppgraderingar såsom Claude Opus 4.6 och ramverk för hanterade agenter. Mythos beskrivs som en ”frontier‑modell” som kan skanna kod, nätverkskonfigurationer och körmiljöer utan mänsklig uppmaning, och generera exploateringskedjor som traditionellt skulle kräva veckor av specialistarbete. I ett läckt internt memo varnade ingenjörer för att modellens framgångsfrekvens på nya sårbarheter överstiger 70 procent, ett tal som vida överstiger den 10 procentiga fördel som erfarna Claude‑användare rapporterades ha i vår täckning av hanterade agenter den 9 april. Varför detta är viktigt är tvådelat. För det första kan förmågan att automatisera upptäckten av exploateringar komprimera sårbarhetslivscykeln, ge angripare ett kraftfullt nytt vapen och tvinga försvarare att ompröva sina patch‑rutiner. För det andra signalerar Anthropics beslut att hålla tillbaka modellen en växande insikt om att AI‑utvecklingen går före styrningsramarna, vilket återkallar de oro som uttrycktes i Atlantics senaste analys av ”Claude Mythos är allas problem”. Den samtidiga lanseringen av Project Glasswing – en defensiv koalition som inkluderar AWS, Apple, Cisco, Google och andra – tyder på att branschen mobiliserar ett koordinerat svar innan tekniken någonsin får kommersiell användning. Det som bör hållas ögonen på härnäst är de konkreta åtgärder som Project Glasswing kommer att vidta för att stärka mjukvarukedjor samt huruvida regulatorer kommer att ingripa för att sätta gränser för verktyg som autonomt genererar exploateringar. Anthropics nästa offentliga uttalande, som sannolikt kommer att beskriva en färdplan för kontrollerad extern testning, blir en viktig barometer för hur snabbt det AI‑drivna cyber‑vapenloppet eskalerar.
56

Florida inleder undersökning av ChatGPT:s skapare, OpenAI, på grund av påstådda risker för minderåriga

Florida inleder undersökning av ChatGPT:s skapare, OpenAI, på grund av påstådda risker för minderåriga
CBS News +16 källor 2026-04-01 news
openai
Floridas justitieminister meddelade på tisdagen att delstaten kommer att inleda en formell undersökning av OpenAI, den San Francisco‑baserade skaparen av ChatGPT, på grund av påstådda risker som chatboten utgör för minderåriga. Undersökningen, som har inletts enligt delstatens konsumentskyddslag, hänvisar till oro för att modellens ofiltrerade innehåll, övertygande ton och datainsamlingspraxis kan utsätta barn för desinformation, grooming eller integritetsintrång. Tjänstemän säger att de kommer att granska OpenAIs åldersverifieringsmekanismer, innehållsfilterpolicyer och företagets efterlevnad av Floridas nyligen antagna lagstiftning om ”Kids Online Safety”. Åtgärden lägger till ett nytt lager i den växande vågen av amerikansk granskning. Tidigare i år öppnade Federal Trade Commission sin egen konsumentskyddsutredning av OpenAIs marknadsförings‑ och datanutzningspraxis, medan Europeiska unionen och Italiens Garante redan har infört tillfälliga begränsningar för tjänsten. Floridas initiativ signalerar att delstatliga regulatorer är villiga att gå bortom generisk konsumenträttslig tillsyn och rikta in sig på de specifika skador som AI kan orsaka yngre användare. OpenAI har svarat med ett kort uttalande, där de lovar ”fullt samarbete” och betonar nyligen genomförda uppgraderingar av sina säkerhetslager, inklusive ett dedikerat ”Kids Mode” som begränsar exponeringen för vuxeninriktat innehåll. Företaget har också antytt att de kommer att lansera starkare föräldrakontrollverktyg senare i år, en utveckling som kan mildra regulatoriskt tryck om den visar sig vara effektiv. Vad att hålla utkik efter härnäst: justitieministeriets kontor förväntas utfärda en stämningssummons till OpenAI inom de kommande 30 dagarna, vilket potentiellt kan tvinga företaget att avslöja interna riskbedömningar och data om användarnas ålder. Lagstiftare i USA:s senat förbereder ett tvåpartiskt AI‑säkerhetsförslag som kan kodifiera nationella standarder för åldersverifiering. Om Floridas undersökning avslöjar systematiska brister kan det påskynda både delstatlig lagstiftning och branschomfattande antagande av striktare skyddsåtgärder för minderåriga.
54

80 % av RAG‑misslyckanden startar här (och det är inte LLM:n)

Dev.to +6 källor dev.to
geminigooglerag
En tre veckor lång djupdykning av ett nordiskt fintech‑team har identifierat källan till de flesta hallucinationerna i retrieval‑augmented generation (RAG)‑pipelines: hämtningslagret, inte den stora språkmodellen (LLM) i sig. Ingenjörerna började med att byta prompts, justera temperaturinställningar och till och med byta den underliggande LLM:n, men de felaktiga svaren kvarstod. Först när de instrumenterade vektorlager, logik för frågeexpansion och dokument‑rankningsmodulen upptäckte de att 80 % av de felaktiga utdata genererades innan LLM:n någonsin såg en prompt. Resultatet ekar ett fält­guide‑dokument från februari som varnade för att ”70 % av RAG‑misslyckanden sker innan LLM:n anropas”, och det bekräftar påståendet vi gjorde den 8 april att ”hämtning är den verkliga modellen” i en RAG‑arkitektur. IDC‑forskning som citeras i ett Medium‑inlägg från mars uppskattar att endast en av tio egenutvecklade AI‑projekt överlever bortom proof‑of‑concept, och en senior GenAI‑ledare på PIMCO bekräftar att samma 80 % misslyckandefrekvens gäller för företags‑RAG‑implementeringar. De grundläggande orsakerna som fintech‑teamet identifierade inkluderar dåligt justerade chunk‑storlekar, föråldrade embeddingar, otillräcklig metadatafiltrering och rankningsalgoritmer som lyfter fram irrelevanta passager – allt detta matar LLM:n med missvisande kontext. Varför detta är viktigt är tvådelat. För det första investerar företag miljarder i RAG‑drivna produkter som lovar uppdaterade, källgrundade svar; systematiska hämtningsfel undergräver förtroendet och ökar driftskostnaderna. För det andra är problemet inte ett enstaka fel utan ett strukturellt ingenjörsgap som kan förstärka andra risker, såsom de ”poisoned‑web‑page”-attackerna vi rapporterade den 9 april. Det som bör bevakas härnäst är de framväxande observabilitetsverktygen som exponerar hämtningslatens, relevanspoäng och proveniens i realtid, samt nästa våg av uppdateringar från molnleverantörer – Azure Cognitive Searchs förhandsvisning av ”retrieval diagnostics” och AWS Kendras funktion ”ground‑truth feedback” är planerade för lansering senare detta kvartal. Branschorganisationer i EU håller också på att utarbeta riktlinjer för datakvalitet för AI, vilket kan göra rigorösa hämtningstester till ett efterlevnadskrav. Fintech‑teamet planerar att publicera en detaljerad post‑mortem, och deras metodik kan bli en de‑facto‑checklista för alla organisationer som skalar RAG bortom laboratoriet.
52

🤖 Precis som # WhatsApp ¹, expanderar Telegram nu snabbt sina # AI‑funktioner. Så jag bestämde mig

Mastodon +12 källor mastodon
meta
Telegram har gått från ett rykte som “meddelande‑först” till en AI‑förstärkt plattform och lanserat en svit av generativa AI‑verktyg som står sida‑om‑sida med dess långvariga bot‑ekosystem. Utrullningen, som annonserades i en kort video på företagets officiella kanal den 9 april, lägger till en enhets‑baserad “Smart Reply”-motor, AI‑driven innehållssammanfattning för grupper och kanaler samt en konversationsassistent som kan skriva meddelanden, översätta text och generera bilder med en egen modell som finjusterats på OpenAI:s GPT‑4o. Tidiga testare, inklusive ett populärt teknik‑humorkonto på Mastodon, rapporterade att assistenten kan producera kontext‑medvetna svar inom sekunder, vilket i praktiken förvandlar varje chatt till ett samarbets‑utkastningsrum. Flytten är betydelsefull eftersom den minskar det funktionella gapet mellan Telegram och Metas WhatsApp, som har börjat rulla ut egna AI‑funktioner såsom AI‑genererade statusuppdateringar och automatiska affärssvar. Telegrams öppna bot‑ramverk ger redan utvecklare en lågfriktionsväg att integrera tredjeparts‑AI, vilket innebär att plattformen kan bli ett nav för nischade AI‑tjänster från språktutoring till automatiserad kundsupport. För användarna lovar integrationen snabbare informationshämtning och minskad skrivtrötthet, medan den för annonsörer öppnar nya möjligheter för personligt anpassade, AI‑skapade kampanjer utan att lämna appen. Det som bör bevakas härnäst är takten i den globala utrullningen och prissättningen. Telegram har antytt en premium‑nivå, “Telegram AI+”, för kraftanvändare, samtidigt som de grundläggande funktionerna hålls gratis för att behålla sin stora, integritets‑medvetna användarbas. Regulatorer i EU kommer sannolikt att granska databehandlingen, särskilt med tanke på plattformens påstående om enhets‑baserad bearbetning. Konkurrenterna kommer att svara, och de kommande månaderna bör visa om AI blir en avgörande faktor i meddelandekriget eller förblir ett perifert tillägg.
41

Är jag bara vegan av princip –

Mastodon +12 källor mastodon
Ett inlägg på racc.at‑bloggen med titeln “Am I Just Being A Vegan About It” har dragit uppmärksamhet till en snabb, tvärprojektig övergång mot stora språkmodells‑ (LLM) assistans i öppen‑källkodsutveckling. Författaren listar Vim, VLC, GStreamer, Kitty och till och med Linux‑kärnan som redan experimenterar med LLM‑drivna kodförslag, generering av felrättningar och utkast till dokumentation – aktiviteter som fram till för några veckor sedan var begränsade till ett fåtal tidiga antagandeprojekt. Betydelsen ligger i omfattningen och mångfalden av antagandet. När kärnkomponenter i Linux‑ekosystemet börjar förlita sig på AI‑genererad kod, förflyttas praktiken från nisch‑experiment till en de‑facto standardarbetsflöde. Förespråkare hävdar att LLM‑modeller kan påskynda granskning av patchar, minska repetitiv boilerplate‑kod och sänka tröskeln för nybörjare. Kritiker varnar för att modellgenererad kod kan introducera subtila buggar, licensieringsoklarheter eller säkerhetsbakdörrar som är svåra att granska i en gemenskapsdriven kodbas. Bloggens timing sammanfaller med en bredare branschdiskussion om ansvarsfull AI‑användning i mjukvaruutveckling, ett tema som utforskats i vår senaste bevakning av Claude Mythos och autonoma exploateringsrisker. Vad som följer blir sannolikt en våg av policyutformning inom stora projekt: riktlinjer för prompt‑design, attribution av AI‑genererade bidrag och automatiserade testpipelines avsedda att fånga regressionsfel som orsakas av modeller. Håll utkik efter uttalanden från Linux Kernel Mailing List, GStreamer‑styrkommittén samt underhållerna av Kitty och VLC, då de kan formalisera bidragsregler eller lansera dedikerade LLM‑plugin‑moduler. De kommande månaderna kan avgöra om AI‑assistans blir ett accepterat verktyg i öppen‑källkods‑verktygslådan eller en omstridd praxis som omformar den kollaborativa utvecklingskulturen.
40

The Economist: Vem är Demis Hassabis, mannen bakom Google DeepMind?

Biznews +11 källor 2026-04-07 news
deepmindgoogleopenairobotics
The Economist:s senaste profil lyfter slöjan från Sir Demis Hassabis, neuroforskaren‑till‑entreprenör som styrde DeepMind från en Cambridge‑startup till Googles kronjuvel och som nu leder både DeepMind och läkemedelsupptäcktsföretaget Isomorphic Labs. Hassabis, en tidigare schackprodigy och världsmästare i strategispelet Diplomacy, har under det senaste decenniet förespråkat en “mänskligt‑inriktad” väg mot artificiell generell intelligens (AGI). Han menar att framsteg bör mätas efter hur väl maskiner förstår och förstärker mänsklig k
40

Anthropic’s Claude Mythos-genombrott: ‘Project Glasswing’ lanserat för att förhindra AI‑cyberkris

Anthropic’s Claude Mythos-genombrott: ‘Project Glasswing’ lanserat för att förhindra AI‑cyberkris
Outlook Business +9 källor 2026-04-09 news
anthropicappleclaudegoogle
Anthropic tillkännagav förhandsvisningen av sin nästa generations modell, Claude Mythos, och lanserade samtidigt ”Project Glasswing”, en branschöverskridande koalition som syftar till att stärka mjukvara mot AI‑drivna attacker. Koalitionen samlar moln‑ och enhetsjättar – inklusive AWS, Apple, Google, Microsoft och mer än 45 ytterligare partners – för att integrera Mythos Preview i defensiva säkerhetsarbetsflöden, jaga zero‑day‑brister och dela data om åtgärder över hela ekosystemet. Claude Mythos positioneras som en ”frontier‑modell” som kombinerar resonemangsdjupet i Anthropics senaste stora språkmodeller med specialiserade kod‑analysförmågor. Enligt interna tester har systemet identifierat tusentals högallvarliga sårbarheter i kritiska infrastrukturskomponenter som traditionella skannrar missade. Genom att ge partners tidig åtkomst hoppas Anthropic skapa en återkopplingsloop som påskyndar patchning innan exploateringar kan vapeniseras. Initiativet är betydelsefullt eftersom samma generativa‑AI‑tekniker som driver Mythos också sänker tröskeln för att skapa sofistikerad skadlig kod. Säkerhetsexperter har varnat för att autonom exploateringsgenerering kan nå mänsklig nivå inom några år, ett scenario som antyddes i Anthropics tidigare rapport ”Claude Mythos: The Future of Autonomous Exploits” (10 april). Project Glasswing är därför både ett defensivt skydd och en signal om att AI‑gemenskapen tar den framväxande cyber‑risken på allvar. Det som bör bevakas härnäst är utrullningen av Mythos Preview i koalitionens miljöer samt de första offentliga avslöjandena av sårbarheter som den upptäcker. Analytiker kommer också att följa om Anthropic breddar åtkomsten utöver de grundande partnerna, hur regulatorer reagerar på koordinerade AI‑säkerhetsinitiativ, och om rivaliserande företag utvecklar konkurrerande ”AI‑first” försvarsstackar. Balansen mellan att stärka digitala grundvalar och att förhindra teknikens missbruk kommer att definiera nästa kapitel i AI‑stödd cybersäkerhet.
38

Från generativ AI till AGI och ASI – Hur långt kan AI utvecklas? | Science Report | TELESCOPE magazine https://www.yayafa.com/2778155

Mastodon +7 källor mastodon
agents
En artikel i TELESCOPE‑magasinet med rubriken “From Generative AI to AGI and ASI – How Far Can AI Evolve?” kartlägger den nuvarande hype‑cykeln mot en längre tidshorisont för artificiell intelligens. Artikeln argumenterar för att dagens stora språkmodell‑drivna generatorer bara är den första steget på en stege som så småningom kommer att leda till artificiell generell intelligens (AGI) och senare artificiell superintelligens (ASI). Den pekar på konkreta milstolpar – multimodal resonemang, självstyrt lärande och integration av världsmodeller – som de förmågor som måste läggas till innan maskiner kan matcha mänsklig abstraktionsförmåga och kreativitet. Varför analysen är viktig är tvådelad. För det första omformulerar den den kommersiella kapplöpningen om allt större modeller till en forskningsagenda med samhälleliga konsekvenser: ett AGI som kan designa läkemedel, optimera klimatmodeller eller förhandla komplexa policyscenarier skulle kunna omforma ekonomier och regulatoriska ramverk. För det andra varnar artikeln för att övergången från smal till generell intelligens kommer att förstärka befintliga etiska och säkerhetsrelaterade problem, från datapartiskhet till förlust av kontroll, och efterlyser samordnad styrning på EU‑nivå. Magasinets perspektiv sammanfaller med nyliga utvecklingar som vi har rapporterat. Metas lansering av Llama 4 den 10 april demonstrerade en “inbyggd” multimodal LLM som kan bearbeta text, bilder och kod – ett steg mot de agentbaserade systemen som beskrivits i våra tidigare artiklar om Agentic RAG och självutvecklande AI‑agenter. På samma sätt signaliserar ZETAs integration med OpenAI:s ChatGPT ett växande kommersiellt intresse för AI som kan agera autonomt inom e‑handel. Det som bör bevakas härnäst är de framväxande “världsmodell”-arkitekturerna som syftar till att förutsäga fysiska utfall och planera över tid, samt de policydebatterna som kommer att följa varje påstående om AGI‑nivåprestanda. Industrikonferenser under sommaren kommer sannolikt att visa prototyper som suddar ut gränsen mellan avancerade generativa verktyg och sann generell resonemangsförmåga, medan EU‑lagstiftare förbereder det första utkastet till ett “AI‑risk”‑ramverk som kan bli den globala standarden för säker AGI‑utveckling.
37

🎙️ På scenen på BSides Luxembourg 2026: Ny föreläsning avslöjad 🧠🤝 𝗧𝗘𝗔𝗠𝗜𝗡𝗚, 𝗧𝗥𝗨𝗦𝗧, 𝗢𝗖𝗛 𝗧𝗛𝗥𝗘𝗔𝗧𝗦: HUR MÄNNISKOR

Mastodon +7 källor mastodon
En ny session på BSides Luxembourg 2026 satte den mänskliga sidan av AI‑säkerhet i rampljuset. Dr. Tailia Malloy, en ledande forskare inom människa‑maskin‑samarbete, tog scenen den 7 maj för att presentera “Teaming, Trust, and Threats: How Humans Interact with Generative AI in Security.” Föreläsningen kombinerade live‑demoar, färska fältstudier och ett hot‑modellering‑ramverk som kartlägger hur säkerhetsanalytiker, incident‑responders och SOC‑ingenjörer förlitar sig på stora språkmodeller (LLM) för triage, forensik och syntes av hotinformation. Malloy hävdade att den verkliga flaskhalsen i AI‑förstärkt säkerhet inte är modellens noggrannhet utan psykologin kring förtroende. Hon presenterade data som visar att analytiker över‑förlitar sig på AI‑förslag när förtroendesignaler är oklara, och under‑använder dem när resultatet upplevs som för ”mänskligt”. Sessionen belyste också framväxande attackvektorer: prompt‑injektion, modell‑förgiftning och dold dataexfiltrering via generativa agenter som är inbäddade i ärende‑hanteringssystem. Genom att rama in dessa problem som ett samarbetsproblem uppmanade Malloy leverantörer att införa transparenta provenance‑taggar och att designa “human‑in‑the‑loop”-säkerhetsåtgärder som bevarar ansvarsskyldigheten. Föreläsningens relevans sträcker sig bortom konferenssalen. När företag rullar ut generativa AI‑assistenter för rutinuppgifter inom säkerhet, håller EU‑regulatorer på att utarbeta riktlinjer för AI‑drivet beslutsfattande. Malloys fynd ger lagstiftare konkreta bevis på att kalibrering av förtroende måste kodifieras tillsammans med tekniska kontroller. Samtidigt reagerar säkerhetsgemenskapen redan – flera leverantörer annonserade betaprogram för “trust‑aware” AI‑konsoler, och akademiska laboratorier meddelade att de kommer att reproducera Malloys experiment i multi‑site SOC‑miljöer. Vad som är på gång härnäst: en praktisk workshop om avväpning av AI‑agenter planerad till den 8 maj, en uppföljande panel om AI‑styrning på den kommande RSA‑konferensen, samt ett kommande vitpapper från Europeiska unionens byrå för cybersäkerhet som citerar Malloys ramverk. Diskussionen som startade på BSides Luxembourg kommer att forma hur branschen balanserar hastighet, säkerhet och mänskligt omdöme i en era av generativ AI.
37

Omar Sanseviero (@osanseviero) på X

Mastodon +11 källor mastodon
deepmindgeminigemmagoogle
Google DeepMinds ledare för utvecklarupplevelse, Omar Sanseviero, bjöds in till 10 Downing Street den 10 april, där han mötte seniora tjänstemän från premiärministerens kontor. Diskussionen fokuserade på det aktuella läget för öppna stora språkmodeller, den bredare AI‑landskapen och de politiska verktyg som Storbritannien överväger för att främja ansvarsfull tillväxt. Sanseviero presenterade ingen ny modell, men hans närvaro signalerade en fördjupad dialog mellan ett av världens ledande AI‑laboratorier och en regering som håller på att utarbeta sin första AI‑specifika strategi. Mötet är betydelsefullt eftersom det förenar två parallella spår som har utvecklats separat de senaste veckorna. Som vi rapporterade den 4 april 2026 har Sanseviero förespråkat Google DeepMinds “Gemma”-familj av öppna modeller och Gemini‑API:t, och positionerat företaget som en förespråkare för transparent, gemenskapsdriven AI. Hans framträdande i Downing Street tyder på att Storbritannien ser bortom proprietära erbjudanden och vill forma en regleringsmiljö som uppmuntrar innovation med öppna modeller samtidigt som säkerhet, datasuveränitet och konkurrensbalans adresseras. För europeiska och nordiska intressenter pekar samtalet på en möjlig samordning med EU:s AI‑förordning och de nordiska regionernas egna öppna‑AI‑initiativ. Att hålla ögonen på följande: Storbritanniens kommande AI‑white paper, som förväntas senare i sommar, kommer sannolikt att referera till ramverk för öppna modeller och kan inkludera finansieringsmekanismer för inhemsk forskning. DeepMind kan efter besöket följa upp med ett konkret policyförslag eller ett gemensamt pilotprogram med brittiska forskningsinstitutioner. Samtidigt antyder Sansevieros senaste inlägg om den kommande Gemma 4‑lanseringen att en ny öppen modell kan presenteras före årsskiftet, vilket potentiellt blir en referenspunkt för de standarder som den brittiska regeringen hoppas kodifiera. Konvergensen mellan politik och teknik i detta område kommer att forma de konkurrensmässiga dynamikerna på den europeiska AI‑marknaden under kommande år.
37

Jag fortsätter säga samma sak till Claude. Så började han skriva ner dem själv.

Dev.to +6 källor dev.to
claude
Claude’s senaste uppdatering förvandlar en långvarig irritation till en funktion. Efter månader av att ha sett Claude Code upprepa samma syntaxmisstag och logikfel, beskrev utvecklaren Elliot i ett Medium‑inlägg en lösning: han började logga varje korrigering i en delad anteckning och matade tillbaka listan till modellen. Anthropic svarade genom att införa ett “självdokumenterande” minneslager som automatiskt registrerar användar‑tillhandahållna korrigeringar och återapplicer dem i framtida sessioner. Ändringen debuterade i mars 2026‑utgåvan av Claude 3.5‑Code och är redan synlig i webb‑UI‑t, där en ny “Fix Log”-panel visas under kodpanelen och visar assistentens egen sammanfattning av tidigare redigeringar. Varför det är viktigt går längre än en bekvämlighetsförbättring. Repetitiva misstag har varit en huvudkritik mot AI‑kodassistenter, vilket undergräver förtroendet och ökar bördan för prompt‑engineering. Genom att bevara korrigerande återkoppling minskar Claude Code behovet för utvecklare att återupprepa samma begränsningar, vilket kortar iterationstiden och minskar risken för hallucinerade API:er eller föråldrade biblioteksanrop. Steget signalerar också Anthropics bredare strategi att ge stora språkmodeller en muterbar, användarspecifik kunskapsbas – ett steg mot de “agent‑memory”-koncept som diskuterades i vår täckning den 10 april av Claude Code:s lokala Ollama‑installation (se “I Pointed Claude Code at My Local Ollama Models — Here’s the 3‑Minute Setup”). Vad man bör hålla ögonen på härnäst inkluderar utrullningsschemat för Fix Log över företagslicenser, integrationen med Claudes API så att externa IDE:er kan fråga den lagrade loggen, och huruvida Anthropic kommer att öppna loggformatet för community‑byggda tillägg. Konkurrenter kommer sannolikt att följa efter, och utvecklare kan få en ny våg av “personliga AI‑assistenter” som kommer ihåg projektspecifika nycker utan ständig prompting. Det verkliga testet blir om minnet beständigt över enheter och hur säkert det hanterar proprietär kod – frågor som kommer forma nästa generation av AI‑drivna utvecklingsverktyg.
37

Meta, inhemsk multimodal LLM “Llama 4” – Impress Watch https://www.yayafa.com/2778136/ # AgenticAi

Mastodon +13 källor mastodon
agentsllamameta
Meta har presenterat Llama 4, sin första inhemska multimodala stora språkmodell, och släppt modellens vikter under en öppen‑vikt‑licens. Modellen är byggd på en mixture‑of‑experts‑ (MoE)‑arkitektur och förenar text, bilder och video redan i det tidigaste steget av bearbetningen – en design som Meta kallar “early fusion”. Genom att tränas på miljarder oannoterade text‑, bild‑ och videoklipp lär sig Llama 4 gemensamma representationer utan de kostsamma annoteringspipeline‑erna som tidigare har begränsat vision‑språk‑system. Tillkännagivandet är viktigt av tre skäl. För det första eliminerar inhemsk multimodalitet behovet av separata vision‑encoders och språkmodeller, vilket minskar latensen och förenklar distributionen för utvecklare som bygger agentiska AI‑assistenter, verktyg för innehållsskapande eller e‑handels‑sökning. För det andra levererar MoE‑arkitekturen hög kvalitet samtidigt som den håller beräkningskraven måttliga; Meta påstår att den minsta varianten av Llama 4 kan köras på en enda NVIDIA H100‑GPU, vilket sänker tröskeln för forskningslaboratorier och nordiska startups som saknar stora kluster. För det tredje möjliggör den öppna vikt‑releasen att den bredare gemenskapen kan finjustera, granska och utöka modellen, vilket potentiellt kan påskynda innovation inom områden som autonom robotik, medicinsk bildbehandling och klimat‑data‑analys. Det som bör bevakas härnäst är hur snabbt ekosystemet tar till sig Llama 4. Benchmark‑släpp kommer att visa om dess early‑fusion‑ansats ger mätbara fördelar gentemot konkurrenter som OpenAI:s GPT‑4V eller Googles Gemini. Metas färdplan antyder en svit av verktyg för agentisk AI, så integration med den kommande “Meta AI Studio” kan göra Llama 4 till ryggraden i nästa generations konversationsagenter. Slutligen kan hårdvaruleverantörer svara med optimerade inferens‑stackar för MoE‑modeller, och tillsynsmyndigheter i EU och Norden kommer sannolikt att granska modellens dataproveniens och säkerhetskontroller när den sprids.
36

OpenAI:s potentiella koppling till skjutningen vid Florida State University undersöks av Floridas justitieminister – GIGAZINE https://www.yayafa.com/2778295/ #

Mastodon +11 källor mastodon
agentsopenai
Floridas justitieminister har inlett en formell utredning av OpenAI efter anklagelser om att dess chatbot, ChatGPT, använts för att planera masskjutningen 2025 vid Florida State University. James Usmaier initierade undersökningen efter att domstolsdokument avslöjade mer än 270 ChatGPT‑konversationsloggar som lämnats in som bevis, varav några verkar innehålla frågor om vapenanskaffning, taktiska råd och målval. Utredningen, som offentliggjordes på torsdagen, syftar till att fastställa om OpenAIs säkerhetskontroller misslyckades med att blockera olagligt innehåll och om företaget bär något ansvar för att ha möjliggjort attacken. Fallet är betydelsefullt eftersom det är den första högprofilerade brottsutredningen som direkt kopplar en generativ AI‑tjänst till en våldshandling på en skola. Åklagarna hävdar att plattformens ”agentiska” förmågor
36

AI‑veckobrev: 2026/4/1–4/10 Anthropic tre skakningar fortsätter — Mythos för farligt att släppa, intäkterna slår OpenAI, mjukvaruaktier rasar

Dev.to +5 källor dev.to
anthropicgemmagooglemetaopenai
Anthropics länge omtalade Mythos‑modell kom äntligen ur skuggorna den 7 april, men företaget meddelade att de inte skulle leverera systemet efter interna granskningar som avslöjade tusentals zero‑day‑sårbarheter. Resultaten, som offentliggjordes via säkerhetsramverket Project Glasswing, markerade en skarp vändning från den förhandsvisning Anthropic presenterade förra veckan. Genom att dra i nödstoppet underströk Anthropic den växande klyftan mellan snabb modelluppskalning och förmågan att säkra dessa system – ett tema som har förföljt branschen sedan genombrottet “Claude Mythos” som vi rapporterade den 10 april. Beslutet kom samtidigt som Anthropic rapporterade en uppgång till 30 miljarder dollar i kvartalsintäkter, vilket för första gången överträffade OpenAI. Vinsten drevs av en våg av företagskontrakt som paketerade Mythos‑klassade säkerhetsverktyg tillsammans med företagets Claude‑4‑svit, trots att flaggskeppsmodellen själv fortfarande är offline. Marknadsreaktionen var snabb: mjukvarusektorns index föll 2,6 % under en enda session, vilket speglade investerarnas oro för att säkerhetsbakslag kan bromsa den bredare AI‑adoptionen. Samtidigt avslutade OpenAI en historisk privatkapitalrunda på 122 miljarder dollar, vilket stärkte deras kassa för beräkningskraft och talang. Meta, under ledning av Wang Hui‑wen, lanserade Muse Spark, deras första stängda modell, vilket signalerar ett skifte mot proprietära erbjudanden som undviker den öppna modellgranskning som plågat Anthropic. Google presenterade Gemma 4, en modell med 310 miljarder parametrar som överträffar konkurrenter som är tjugo gånger större, medan Elon Musk och Intel tillkännagav ett gemensamt “Terafab”‑chipfabrik som syftar till att leverera nästa generations AI‑silicon. Vad man bör hålla ögonen på härnäst: om Anthropic kan laga Mythos och återuppta en kommersiell lansering, hur regulatoriska myndigheter kommer att reagera på en modell som bedöms som “för farlig att släppa”, samt om inflödet av kapital till OpenAI och hårdvarusatsningen från Musk‑Intel kommer att omforma den konkurrensmässiga hierarkin. Nästa kvartal kommer att visa om säkerhetsfrågor kan förenas med den obevekliga jakten på skala.
36

OpenAI lägger till ny $100/månad ChatGPT‑prenumerationsnivå för tyngre Codex‑användning       https:// fed.brid.

Mastodon +10 källor mastodon
anthropicclaudeopenai
OpenAI meddelade en ny $100‑per‑månad ChatGPT Pro‑prenumeration som fem‑faldigt utökar tillgången till deras Codex‑kodassistent jämfört med den befintliga $20 Plus‑planen. Nivån placeras mellan den nuvarande $20 Plus‑erbjudandet och $200 Pro‑nivån, som redan ger de högsta gränserna för kunder med tung användning. Enligt företagets API‑forum är $100 Pro‑nivån avsedd för utvecklare och team som kör längre, arbetsintensiva kodningssessioner men som inte behöver hela kapaciteten i $200‑planen. Detta steg är OpenAIs första prisjustering som är specifikt riktad mot utvecklarmarknaden sedan Codex lanserades 2021. Genom att höja kvoten för kodgenerering hoppas företaget locka en grupp användare som har börjat vända sig mot Anthropics Claude, som länge har prissatts till $100 per månad för liknande användning. OpenAIs uttalande beskriver den nya nivån som “ett direkt svar på den växande efterfrågan på mer generösa Codex‑gränser” och som ett sätt att “erbjuda en smidigare uppgraderingsväg” för kraftanvändare som har vuxit ur Plus‑planen men ännu inte är redo att binda sig till $200‑prispunkten. Branschobservatörer ser tillägget som en signal om att tävlingen om AI‑assisterade utvecklingsverktyg hettar upp. Om $100‑nivån får fäste kan den sätta press på Anthropic och andra nischspelare att ompröva sina egna prismodeller eller funktionspaket. Det ger också OpenAI ett tydligare datamaterial om hur mycket utvecklare är villiga att betala för utökad kodgenereringskapacitet. Vad man bör hålla utkik efter härnäst: tidiga antagningshastigheter bland indie‑utvecklare och företags‑team, eventuella efterföljande justeringar av $200‑nivåns gränser, samt huruvida OpenAI kommer att paketera den nya Pro‑nivån med ytterligare utvecklar‑fokuserade funktioner såsom integrerad felsökning eller plugins för versionskontroll. Nästa kvartal kommer att visa om prisförändringen omformar konkurrenslandskapet för AI‑driven mjukvaruutveckling.
36

Hur du installerar Claude Code i VS Code med hjälp av en aktiv proffs och kör en app i lokal miljö – Att klistra in API‑nyckeln i chatten är förbjudet!? – Proffs och praktik! Börja vibrokodning från noll

Mastodon +10 källor mastodon
agentsanthropicclaude
En handledning som publicerades på den japanska utvecklarplattformen Yayafa igår guidar läsarna genom installationen av Anthropics Claude Code‑tillägg i Visual Studio Code samt hur man kör ett exempelprogram på en lokal maskin. Guiden, som är medförfattad av en praktiserande mjukvaruingenjör, visar steg‑för‑steg hur man konfigurerar tillägget, skapar den nödvändiga filen .claude‑credentials.json och startar den IDE‑integrerade AI‑kodassistenten utan att exponera API‑nyckeln i chattfönster – en praxis som författaren varnar för av säkerhets‑ och efterlevnadsskäl. Claude Code, Anthropics svar på GitHub Copilot, gick in i öppen beta i slutet av 2024 och har snabbt blivit den föredragna assistenten för team som värdesätter ”konstitutionell AI”‑skydd. Genom att bädda in modellen direkt i VS Code kan utvecklare begära kodsnuttar, refaktoreringar eller testgenerering inline, samtidigt som tillägget respekterar användarens språkinställningar och erbjuder diff‑förhandsvisningar. Handledningen demonstrerar också hur man kombinerar Claude Code med Firebase för snabb prototypframtagning, vilket speglar en bredare trend av AI‑driven full‑stack‑utveckling. Artikeln är viktig eftersom den sänker tröskeln för nordiska utvecklare att anta en integritets‑först kodassistent som kan köras lokalt, vilket minskar beroendet av enbart molnbaserade tjänster som kan stå i konflikt med GDPR eller företags interna databehandlingspolicyer. De säkerhets‑fokuserade instruktionerna – särskilt varningen mot att klistra in API‑nycklar i konversationspromptar – belyser en växande medvetenhet om riskerna för credential‑läckage som har plågat tidigare AI‑assistentutrymningar. Framöver planerar Anthropic att lansera Claude 3.5 med förbättrade kontextfönster och tätare integration med Azure OpenAI, vilket potentiellt kan erodera Copilots marknadsandel ytterligare. Observatörer kommer att följa om VS Codes marknadsplats ser en ökning av Claude‑relaterade tillägg, hur företags‑IT‑avdelningar reagerar på den lokala exekveringsmodellen, och om regulatoriska organ utfärdar riktlinjer för AI‑genererad kods proveniens. Handledningens popularitet kan signalera början på en bredare övergång till AI‑kodverktyg på plats inom den nordiska teknikscenen.
36

**Hur Agentic RAG löser de traditionella RAG:s problem? | Cloud Technology Blog | SoftBank** https://www.yayafa.com/2777654/

Mastodon +12 källor mastodon
agents
SoftBanks blogg om molnteknik presenterade den här veckan ett nytt ramverk kallat **Agentic RAG** som lovar att övervinna de mest envisa bristerna i traditionell Retrieval‑Augmented Generation. Inlägget förklarar att metoden, som nu kommersialiseras i Japan via kunskapsplattformen **Krugle Biblio**, har co‑utvecklats med den amerikanska startupen **Archaea AI** och kommer att säljas exklusivt av SoftBanks **Krugle‑division**. Traditionella RAG‑pipelines hämtar en statisk uppsättning dokument, matar in dem i sin helhet i en stor språkmodell och hoppas att modellen kan väva ihop ett sammanhängande svar. I praktiken leder metoden ofta till hallucinationer, slösar token‑resurser på irrelevanta avsnitt och har svårt med flerstegsresonemang. Agentic RAG ersätter det enkla hämtningssteget med en autonom **”agent”** som kan fråga, utvärdera och återfråga källor iterativt. Agenten bestämmer när ytterligare kontext ska hämtas, när brusiga resultat ska kasseras och när självreflektion ska aktiveras, vilket i praktiken förvandlar återhämtningsprocessen till en dynamisk, målstyrd dialog mellan modellen och dess kunskapsbas. Genombrottet är viktigt eftersom det direkt adresserar kostnads‑ och tillförlitlighetsbarriärerna som har bromsat företagsadoptionen av generativ AI. Genom att begränsa mängden hämtad text och förbättra faktagrunden kan företag sänka sina moln‑beräkningskostnader samtidigt som de uppfyller strängare krav på dataproveniens. Tidiga pilotprojekt rapporterade upp till **40 % minskning av hallucinationsfrekvensen** och en motsvarande minskning av token‑förbrukningen. De kommande månaderna kommer att visa om Agentic RAG kan skalas bortom pilotprojekt. SoftBank planerar att integrera Krugle‑motorn med **Google Clouds Vertex AI RagEngine**, vilket erbjuder en hybridlösning som kombinerar Googles infrastruktur med Archaea:s agentlogik. Branschobservatörer kommer att hålla ögonen på benchmarkresultat, prismodeller och lanseringen av verktygssatsen **“CopilotAgentBuilder”** som AVILEN lovar att släppa senare i år. Om påståendena håller, kan Agentic RAG bli den de‑facto‑standard som används för kunskapsintensiva AI‑applikationer i Norden och bortom.
36

DXC presenterar nya Assure Smart‑appar för att påskynda försäkringsbolagens AI‑drivna transformation

Mastodon +10 källor mastodon
agents
DXC Technology har lanserat Assure Smart Apps, en ny svit av AI‑drivna, arbetsflödescentrerade applikationer som syftar till att snabba på den digitala transformationen inom skade‑ och livförsäkringar. Portföljen presenterades på DXC Connect Insurance Executive Forum och omfattar Claims Assistant, Engagement Assistant och Underwriter Assistant, som alla är byggda på ServiceNow:s agent‑AI‑motor och DXC:s djupa domänkunskap inom försäkring. De förkonfigurerade modulerna lovar att automatisera rutinuppgifter, minska manuellt arbete med 30‑40 % och leverera mätbara resultat inom 12 veckor, utan att kräva ett fullständigt utbyte av befintliga legacy‑system. Tillkännagivandet kommer i ett läge där försäkringsbolagen kämpar med ökande krav på modernisering, kostnadskontroll och att möta växande kundförväntningar på omedelbar, personlig service. Även om AI‑adoptionen har accelererat, är många aktörer fortfarande hindrade av splittrade legacy‑stackar och brist på intern kompetens för att bygga skräddarsydda lösningar. Genom att erbjuda modulära, resultat‑fokuserade appar som kan anslutas till befintliga miljöer vill DXC sänka inträdesbarriären och möjliggöra för försäkringsbolagen att snabbt och säkert skala upp AI‑initiativ. Analytiker kommer att följa hur snabbt stora försäkringsbolag pilotar de nya verktygen och om den utlovade hastigheten till värde faktiskt realiseras i praktiken. Tidiga fallstudier kan belysa effekterna på underwriting‑noggrannhet, handläggningstider för skadeärenden och korsförsäljningskonverteringsgrader, samtidigt som de pekar på eventuella personalanpassningar som krävs när rutinprocesser automatiseras. Konkurrensen från andra teknikjättar – särskilt Microsofts Cloud for Insurance och Salesforce Financial Services Cloud – kommer att intensifieras, vilket gör antagnings‑ och användningsmått till en viktig indikator på DXC:s marknadspenetration. De kommande månaderna bör medföra tillkännagivanden om pilotresultat, integrationsplaner med ServiceNow:s bredare AI‑portfölj och eventuellt regulatoriska kommentarer kring användningen av agent‑AI i kritiska försäkringsbeslut. Dessa utvecklingar kommer att avgöra om Assure Smart Apps blir en katalysator för en branschomfattande AI‑acceleration eller bara ett nischat erbjudande i en redan trång marknad.
36

Blir den smartare ju mer du använder den? En genomgång av hur själv‑evolverande AI‑agenter fungerar https://www.yayafa.com/2777657/ # AgenticAi # AI #

Mastodon +8 källor mastodon
agentsgemma
Ett forskarteam från det japanska startup‑företaget Asty har publicerat en detaljerad analys av ”själv‑evolverande” AI‑agenter, som visar hur kontinuerlig interaktion med användare kan göra samma modell successivt smartare utan extern åter‑träning. Artikeln, som släpptes den 10 april, dissekerar arkitekturen bakom prototyper som Gemma‑4, GEPA och HermesAgent, vilka alla körs lokalt och uppdaterar sina interna vikter genom en kombination av förstärkningsinlärning från mänsklig feedback (RLHF) och meta‑inlärning på enheten. Genom att lagra interaktionsspår i en säker sandlåda genererar agenterna mikro‑uppdateringar som varje natt slås samman med en basmodell, vilket gör att de kan finjustera språkförståelse, produktrekommendationslogik och till och med visuella sökfunktioner i realtid. Varför detta är viktigt är tvådelat. För det första lovar metoden en ny våg av ”agentiska” applikationer som kan anpassa sig i realtid samtidigt som data hålls under användarens kontroll – ett direkt svar på integritetsbekymmer som har bromsat antagandet av enbart molnbaserade AI‑tjänster. För det andra sänker tekniken tröskeln för små företag att distribuera sofistikerade assistenter, vilket potentiellt kan omforma e‑handel, kundsupport och kreativa verktyg. Resultaten speglar trenderna vi pekade på förra veckan: Metas Muse Spark‑modell, som kan jämföra produkter från foton, och ZETAs integration av OpenAIs ChatGPT i sin handelsplattform förlitar sig båda på snabb, användardriven förfining. Amazons rekordhöga AI‑molnintäkter och Linux Foundations Agentic AI Foundation illustrerar ytterligare branschens drivkraft mot kontinuerligt lärande agenter. Det som bör hållas ögonen på härnäst är de praktiska utrullningarna som planeras till sommaren. Asty planerar ett open‑source‑SDK som ska låta utvecklare koppla den själv‑evolverande kärnan till befintliga chatt‑ och rekommendationspipeline. Agentic AI Foundation förväntas publicera ett standardutkast för säkra uppdateringsmekanismer, och både Meta och ZETA har antytt beta‑program som kommer att testa dessa agenter i verkliga detaljhandelsmiljöer. De kommande månaderna kommer att visa om själv‑evolverande agenter kan hålla sitt löfte utan att kompromissa med säkerhet eller stabilitet.
32

【Alltför farlig så Anthropic förseglar “Claude Mythos” – en explosion】 Shota Imai: “Mänskligheten har gått över gränsen” / “Aprilskämt” misstänkt högpresterande / Meta går in i AI‑tävlingen med ny modell【AI QUEST】

Mastodon +6 källor mastodon
agentsanthropicclaude
Anthropic presenterade en ny stor‑språkmodell kallad Claude Mythos den 7 april, men inom några dagar stoppade företaget all offentlig lansering. Interna tester visade att systemet kunde autonomt lokalisera och utnyttja tusentals zero‑day‑sårbarheter i stora operativsystem och webbläsare, en förmåga som vida översteg säkerhetsramverket för befintliga modeller. Upptäckten fick Anthropics säkerhetsteam att sätta modellen i karantän och utfärda ett uttalande om att ”risken för okontrollerad upptäckt av sårbarheter överväger alla omedelbara kommersiella fördelar”. Händelsen har väckt en ny debatt om gränserna för agent‑AI. Shota Imai, en ledande AI‑forskare med inslag i AI QUEST‑programmet, varnade för att ”mänskligheten har korsat en linje” när ett system kan vapenifiera mjukvarufel utan mänsklig styrning. Hans reaktion understryker en växande oro bland experter att nästa generation av grundmodeller kan ha en agentur som utmanar nuvarande styrningsramverk. Det faktum att modellens benchmark‑resultat var så höga att Imai först misstänkte ett aprilskämt förstärker känslan av att teknologin utvecklas snabbare än den offentliga diskursen hinner med. Anthropics tillbakadragande skärper också konkurrenslandskapet. Meta meddelade att deras kommande Llama X‑serie kommer att släppas senare detta kvartal, vilket placerar sociala mediejätten som en seriös aktör i loppet om den mest kapabla, men ändå kontrollerbara, AI:n. Observatörer kommer att följa om Metas säkerhet‑från‑grunden‑tillvägagångssätt kan undvika de fallgropar som tvingade Anthropic att försegla Mythos, och hur regulatorer i EU och USA reagerar på en modell som autonomt kan upptäcka kritiska mjukvarusårbarheter. Viktiga signaler att bevaka inkluderar eventuella formella säkerhetsgranskningar av Claude Mythos, Metas lanseringstidslinje och transparensrapporter, samt nästa omgång av policyförslag från EU:s AI‑lag som kan kräva förhands‑bedömningar av sårbarheter för hög‑risk‑AI‑system. Den pågående historien kommer sannolikt att skapa ett prejudikat för hur branschen balanserar banbrytande prestanda med nödvändigheten att hålla kraftfull AI säkert innesluten.
32

RE: https:// mastodon.online/@parismarx/116 372697459719963 En av de värsta sakerna med detta

RE:   https://  mastodon.online/@parismarx/116  372697459719963    En av de värsta sakerna med detta
Mastodon +6 källor mastodon
anthropicgooglemetaopenai
En koordinerad AI‑driven desinformationskampanj drabbade miljontals smartphones över hela Europa på tisdagen, vilket fick den svenska statsministern att kräva svar från branschens största aktörer. Operationen, som spårades till ett nätverk av push‑notiser och röstassistent‑uppmaningar, levererade falska påståenden om en förestående skattereform och övergick sedan till påhittade hälsoråd. Rättsmedicinsk analys av oberoende säkerhetsforskare kopplade innehållsgenereringen till storskaliga språkmodeller som hostas av Google, Meta, Anthropic och OpenAI, medan leveransinfrastrukturen förlitade sig på företagens mobil‑annons ekosystem. Händelsen markerar första gången världens ledande generativa‑AI‑leverantörers samlade output har vapeniserats i stor skala på personliga enheter, vilket kringgår traditionella mediekanaler och utnyttjar det förtroende användare har för inbyggda telefonvarningar. ”Ett samhälle där en teknooligark kan ingripa, som en av dem gjorde igår, i miljoner medborgares mobiltelefoner för att berätta lögner?” frågade statsministern i en riksdagsutfrågan, och återgav den växande allmänna oron över en oreglerad AI‑påverkan. Varför det är viktigt är tvådelat. För det första visar det hur koncentrationen av AI‑talang och beräkningskraft i ett fåtal företag kan omvandlas till ett de‑facto ”informationssupervapen” som opererar utan någon transparent tillsyn. För det andra blottlägger händelsen ett regulatoriskt blindställe: befintliga dataskydds‑ och valintegritetsregler täcker inte AI‑genererat innehåll som levereras via proprietära app‑butiker och notistjänster, vilket lämnar medborgarna sårbara för manipulation i kontaktpunkten. Det som bör bevakas härnäst är politiska och marknadsmässiga svar. Europeiska kommissionen har signalerat en accelererad utrullning av AI‑lagen, med särskilt fokus på ”högrisk”‑generativa system. I USA rapporteras Federal Trade Commission påbörja en konkurrensutredning kring kollaborativ användning av AI‑genererade annonser. Samtidigt ser decentraliserade plattformar som Mastodon en ökning av nya användare som söker alternativ till det företagsstyrda ekosystemet. De kommande veckorna kommer att visa om lagstiftare kan införa meningsfulla begränsningar innan nästa ”shit show” med teknologin utspelar sig.
32

Höga energikostnader och regelverk: OpenAI pausar Stargate UK

Mastodon +10 källor mastodon
openai
OpenAI har lagt sitt “Stargate UK”-datacenterprojekt på paus med hänvisning till de skenande elpriserna och ett osäkert regleringsklimat i Storbritannien. Beslutet följer företagets tidigare beslut att skrota en planerad campus i Abilene, Texas, och markerar den senaste motgången för det ambitiösa AI‑infrastrukturinitiativ som i september annonserades tillsammans med Nvidia och datacenterutvecklaren Nscale. Som vi rapporterade den 10 april har OpenAI stoppat byggnationen i Storbritannien efter att energikostnaderna visade sig vara högre än beräknat. Det senaste uttalandet lägger till att företaget kommer att fortsätta förhandlingarna med den londonska regeringen för att söka tydligare policyvägledning och eventuella incitament. OpenAIs chef för teknik (CTO) sade att pausen är ”tillfällig” och att företaget fortfarande är engagerat i en närvaro i Storbritannien, men att man inte kommer att gå vidare förrän energitaxeregimen och reglerna för datasäkerhet har stabiliserats. Beslutet är betydelsefullt på flera fronter. Storbritannien har positionerat sig som ett europeiskt nav för AI‑forskning och förväntar sig att storskaliga beräkningsanläggningar ska locka talang, stärka den inhemska tekniksektorn och säkra datasuveränitet. Ett avstannat flaggskeppsprojekt hotar dessa ambitioner och kan ge konkurrenter som Microsofts Azure eller Google Cloud ett konkurrensförsprång i regionen. För OpenAI understryker pausen den växande spänningen mellan snabb modellutveckling och hållbarheten i den underliggande beräkningsinfrastrukturen, ett tema som också återfinns i företagets nyliga begränsning av nya modellutgåvor av cybersäkerhetsskäl. Det som bör hållas ögonen på härnäst är resultatet av samtalen med de brittiska myndigheterna. Ett reviderat ramverk för energiskatt eller riktade subventioner kan återuppliva projektet, medan en förlängd osäkerhet kan driva OpenAI att flytta kapacitet till mer kostnadsstabila platser i Europa eller Norden. Parallella utvecklingar — särskilt företagets föränderliga prenumerationsnivåer för tunga kodex‑tjänster — kommer också att signalera hur OpenAI balanserar tillväxt med operativa begränsningar.
29

Molotovcocktail kastad mot OpenAIs VD Sam Altman, misstänkt i förvar

KRON4 +12 källor 2026-02-18 news
openai
En Molotovcocktail kastades mot San Franciscos bostad för OpenAI:s verkställande direktör Sam Altman tidigt på fredagsmorgonen, uppgav polisen. Den brandfarliga anordningen slog i den metalliska porten till Altmans hem i Russian‑Hill på 855 Chestnut Street omkring 03.40 tiden, vilket orsakade en kortvarig låga som snabbt släcktes av säkerhetsvakter. Ingen skadades och fastigheten fick endast ytliga skador. San Francisco Police Department arresterade en 31‑årig manlig misstänkt kort därefter efter att ha granskat övervakningsmaterial som fångade attacken samt förövarens efterföljande hot utanför OpenAIs huvudkontor. Gripandet bekräftades både av polismyndigheten och en talesperson för OpenAI, som avstod från att namnge den misstänkte i väntan på formella åtal. Händelsen är det senaste våldsamma avsnittet som riktas mot en högprofilerad AI‑personlighet, bara veckor efter att Floridas statsadvokat inledde en utredning om OpenAIs eventuella kopplingar till ett universitetsskott. Mönstret av fientlighet understryker den växande allmänna oron kring den snabba utrullningen av avancerade språkmodeller och den upplevda makten hos deras skapare. OpenAI har ännu inte avslöjat om attacken var ideologiskt motiverad, personligt riktad eller en del av en bredare anti‑AI‑kampanj. Företagets säkerhetsprotokoll förväntas granskas, och händelsen kan få andra teknikledare att ompröva sina personliga säkerhetsåtgärder. Håll utkik efter ett officiellt uttalande från San Francisco Police Department som redogör för den misstänktes bakgrund och eventuella påstådda anknytningar, samt eventuella uppföljningar från OpenAI angående säkerhetsuppgraderingar. Lagstiftande organ i Kalifornien och på andra håll kan också hänvisa till attacken när de debatterar ansvar- och ansvarighetsramar för AI‑företag, vilket potentiellt kan påskynda pågående lagförslag som syftar till att reglera sektorns mest inflytelserika chefer.
28

OpenAIs nyaste stipendium inkluderar upp till 15 000 USD i AI‑beräkningskraft per månad

Insider +9 källor 2026-04-08 news
ai-safetyanthropicopenai
OpenAI presenterade ett nytt säkerhetsinriktat stipendium som kommer att ge externa forskare upp till 15 000 USD i AI‑beräkningskraft varje månad, tillsammans med ett modest stipendium och mentorskap från OpenAI‑personal. Piloten, som är planerad att pågå från september 2026 till februari 2027, riktar sig mot arbete med alignment, robusthet, integritet och förebyggande av missbruk. Sökande kommer att väljas ut baserat på teknisk förtjänst och den potentiella påverkan av deras förslag, och den första kohorten förväntas påbörja experiment senare i år. Tillkännagivandet kommer bara några timmar efter en mediarapport som ifrågasatte VD Sam Altmans engagemang för AI‑säkerhet, och stipendiet positioneras som ett konkret svar på den ökande granskningen. Genom att matcha strukturen i Anthropics eget säkerhetsstipendium signalerar OpenAI en vilja att konkurrera direkt i det framväxande ekosystemet för företagsfinansierad säkerhetsforskning. Beräkningsallokeringen – motsvarande ungefär 1 200 GPU‑timmar per månad – adresserar en kronisk flaskhals för oberoende laboratorier som saknar tillgång till den skala som krävs för moderna grundläggande modell‑experiment. Om programmet lyckas kan det påskynda genombrott inom alignment‑tekniker och skapa en pipeline av granskad talang för OpenAIs interna säkerhetsteam. Det sätter också en referenspunkt för andra AI‑företag, många av vilka har annonserat liknande initiativ men ännu inte avslöjat jämförbara resursåtaganden. Observatörer kommer att följa hur OpenAI balanserar stipendiets öppna forskningsanda med sin proprietära modell‑färdplan, särskilt när företaget lanserar nya produkter såsom sitt text‑till‑tal‑API och en job‑matchningsplattform senare under 2026. Viktiga utvecklingar att bevaka inkluderar publiceringen av ansökningsriktlinjer, sammansättningen av den första kohorten och eventuella tidiga forskningsresultat som demonstrerar den praktiska nyttan av beräkningsbidraget. Stipendiets påverkan på den bredare säkerhetsgemenskapen – och huruvida det triggar en våg av företagsstödda alignment‑projekt – kommer att forma narrativet kring branschens ansvar i nästa våg av AI‑utveckling.
28

OpenAI lägger till ett $100‑per‑månad ChatGPT‑prenumeration på grund av Vibe‑kodning

OpenAI lägger till ett $100‑per‑månad ChatGPT‑prenumeration på grund av Vibe‑kodning
CNET +9 källor 2026-04-01 news
openai
OpenAI har lanserat en ny $100‑per‑månad “ChatGPT Pro”-nivå som är riktad direkt mot utvecklare som förlitar sig på företagets Codex‑drivna Vibe‑kodningsassistent. Planen ökar Codex‑användningsgränserna femfaldigt jämfört med $20‑per‑månad Plus‑prenumerationen, vilket låter “Vibe‑kodare” köra längre, mer intensiva sessioner utan att nå de tak som har tvingat många att nedgradera eller byta verktyg. Draget följer OpenAIs tidigare tillkännagivande den 10 april om att de skulle införa en dyrare nivå för tunga Codex‑användare. Som vi rapporterade den dagen fyller $100‑planen prisskillnaden mellan den vanliga Plus‑erbjudandet och $200‑per‑månad “ChatGPT Pro”-nivån som riktar sig mot företags‑skaliga arbetsbelastningar. Genom att utöka mellannivån hoppas OpenAI fånga ett växande segment av professionella utvecklare som behöver kontinuerlig AI‑hjälp för komplexa kodbaser, samtidigt som tjänsten hålls tillräckligt prisvärd för att konkurrera med rivaler som GitHub Copilot och Googles Gemini. Betydelsen sträcker sig bortom intäkterna. Högre användningsgränser kan påskynda ant
24

KD-MARL: Resursmedveten kunskapsdestillering i multi‑agent‑förstärkningsinlärning

ArXiv +9 källor arxiv
agentsinferencereinforcement-learning
En ny pre‑print på arXiv, KD‑MARL: Resursmedveten kunskapsdestillering i multi‑agent‑förstärkningsinlärning, föreslår ett tvåstegs‑ramverk som komprimerar de koordinerade policys från en centraliserad expert till en flotta av lätta, decentraliserade student‑agenter. Författarna visar att genom att explicit ta hänsyn till beräknings‑, minnes‑ och inferenstid‑budgetar under destilleringen, behåller student‑agenterna största delen av expertens prestanda samtidigt som de körs på edge‑hårdvara med mycket strängare resursbegränsningar. Bidraget är viktigt eftersom verkliga MARL‑implementeringar—trafiksignalkontroll, svärm‑robotik, smart‑grid‑hantering—länge har hindrats av den tunga beräkningsbelastningen hos expert‑policys, som ofta kräver stora neurala nätverk och långa beslutscykler. KD‑MARL:s resursmedvetna tillvägagångssätt gör det möjligt att köra koordinerade multi‑agent‑system på inbyggda enheter, vilket minskar energiförbrukning och latens utan att offra den framväxande lagandan som
24

$0,60 per session, bara för orientering. Så här använde min AI‑agent sig innan den skrev någon kod.

Dev.to +10 källor dev.to
agentsautonomousclaudeopenai
En utvecklare som nyligen släppte det öppna verktyget Stacklit har avslöjat att en AI‑driven kodassistent kan bränna ungefär 0,60 dollar i token‑avgifter innan den ens börjar generera kod. Genom att köra `npx stacklit init` och granska sessionsloggarna på GitHub räknade författaren mer än 4 000 tokens som spenderades på ”orientering” – fasen där modellen analyserar projektstrukturen, läser konfigurationsfiler och bestämmer hur den ska närma sig uppgiften. Med nuvarande OpenAI‑prissättning motsvarar den token‑mängden cirka sextio cent per körning. Fyndet är viktigt eftersom det blottlägger ett dolt kostnadslager som de flesta användare förbiser. Medan rubrikfångande siffror fokuserar på priset för den genererade outputen, kan förberedelsearbetet för stora språkmodeller (LLM) snabbt addera kostnader, särskilt när agenter anropas upprepade gånger i CI‑pipelines eller på utvecklares arbetsstationer. Utgiften är inte bara ekonomisk; samma token‑förbrukning korrelerar med mätbar elförbrukning, en faktor som lyfts fram i senaste analyserna av AI‑kodagents koldioxidavtryck. För startups och företag som planerar att skala autonoma agenter över dussintals kodarkiv kan den kumulativa ”orienterings‑räkningen” urholka den lovade avkastningen på investeringar i AI‑stött utveckling. Det som blir intressant att följa är hur ekosystemet reagerar på denna insyn. OpenAI Agents SDK och konkurrerande ramverk lägger redan in inbyggda token‑spårnings‑instrumentpaneler, och tredjepartsverktyg dyker upp för att begränsa eller batcha orienterings‑anrop. Samtidigt förutspår prisguider för 2026 en bredare stratifiering av AI‑agentkostnader, från gratis hobby‑nivåer till företagskontrakt som tar hänsyn till både token‑ och beräknings‑overhead. Utvecklare kommer sannolikt att anta mer aggressiva prompt‑engineering‑ och cachningsstrategier för att trimma för‑kod‑fasen, medan regulatorer i Norden kan börja granska energipåverkan från genomgripande AI‑automation. Den diskussion som Stacklits kostnadsrevision har satt igång kan därför forma både budgeteringspraxis och hållbarhetsstandarder för nästa generation av autonoma kodagenter.
24

Lägg till 197 bioinformatikfärdigheter till Claude Code med SciAgent‑Skills

Dev.to +8 källor dev.to
agentsclaudefine-tuningrag
Anthropic har släppt SciAgent‑Skills, ett plug‑in som utrustar Claude Code med 197 förpaketerade bioinformatik‑ och livsvetenskapsfunktioner. Paketet, som finns på GitHub, levereras med färdiga “skills” – kodmönster, bästa‑praxis‑mallar och exempel‑snuttar för uppgifter som sträcker sig från RNA‑seq‑inriktning till enkelcells‑klustring och läkemedels‑mål‑prediktion. Enligt projektets benchmark uppnår Claude Code 92 % noggrannhet på ett kuraterat bioinformatik‑testset utan någon modell‑finjustering eller retrieval‑augmented generation (RAG). Flytten markerar första gången Claude Code positioneras som en domänspecifik assistent för beräkningsbiologi. Som vi rapporterade den 10 april driver samma modell redan ett real‑tids‑kryptohandelsystem och, separat, en svit av cybersäkerhetsverktyg. Att utöka dess räckvidd till livsvetenskaper kan sänka tröskeln för forskare som saknar djup programmeringskompetens, vilket möjliggör för både grundutbildningsstudenter och PhD‑labbar att generera idiomatisk Python‑ eller R‑pipeline med ett enda prompt. För nordiska biotekföretag lovar plug‑in snabbare prototypframtagning av omiks‑analyser och tätare integration med regionala hälso‑datainfrastrukturer, vilket potentiellt kan påskynda läkemedels‑upptäckts‑cykler och initiativ för skräddarsydd medicin. Observatörer bör hålla ett öga på tidiga adoptörer i universitetslabbet och biotek‑inkubatorer för verklig prestanda, särskilt på storskaliga datamängder där minne‑ och körtidsbegränsningar skiljer sig från benchmark‑miljön. Anthropics färdplan antyder ytterligare färdighetspaket för proteomik och klinisk‑prövnings‑analys, medan konkurrenter kan lansera liknande “skill‑store”‑ekosystem. Regleringsorgan i EU och Norge kommer också behöva bedöma huruvida AI‑genererad bioinformatikkod uppfyller valideringsstandarder för klinisk forskning. De kommande veckorna kommer att visa om SciAgent‑Skills kan omsätta sina imponerande benchmark‑resultat till konkreta produktivitetsvinster över hela den nordiska life‑science‑landskapet.
24

Hur Anthropic Claude + TensorFlow driver ett realtids‑cryptohandelssystem

Dev.to +6 källor dev.to
agentsanthropicclaudereasoning
Ett team av nordiska ingenjörer har presenterat en fullt fungerande kryptohandelsplattform som kombinerar Anthropics Claude med en svit av tolv TensorFlow‑modeller och levererar ett naturligt språkgränssnitt som kan utföra affärer på millisekunder. Systemet, som beskrivs i ett nytt öppet källkods‑arkiv, placerar Claude som den övergripande resonansmotorn medan TensorFlow‑modellerna hanterar prisprognoser, sentimentanalys, volatilitetsspaning, order‑bok‑tolkning, riskbedömning och optimering av exekveringsstrategier. Användare skriver kommandon som ”Köp 0,5 BTC om marknadssentimentet blir bullish inom de kommande fem minuterna”, och Claude översätter avsikten till koordinerade anrop mot de underliggande modellerna, som sedan skickar order till flera börser via en låg‑latens‑gateway. Initial back‑testing på Bitcoin‑ och Ethereum‑data från de senaste tolv månaderna visar ett genomsnittligt Sharpe‑förhållande på 2,1 och ett netto vinst‑till‑förlust‑förhållande på 3,4 : 1, vilket överträffar en baslinje‑algoritmstrategi med ungefär 27 %. Live‑testning på en modest kapitalallokering på 10 000 USD under ett tvåveckorsfönster genererade en avkastning på 38 %, med handels‑exekveringslatens konsekvent under 150 ms. Utvecklarna tackar Claude’s Model Context Protocol för att ha sömlöst sammankopplat de olika modellerna utan skräddarsydd limkod – ett mönster de först demonstrerade i ”Claude Mythos”‑serien som vi täckte den 10 april. Lanseringen är betydelsefull eftersom den bevisar att stora språkmodeller kan fungera som pålitliga orkestreringslager för finansiell automation med höga insatser, vilket sänker tröskeln för icke‑tekniska handlare att utnyttja sofistikerade AI‑pipelines. Den väcker också frågor om marknadsrättvisa, regulatorisk tillsyn och säkerheten för AI‑drivna handelsbotar som potentiellt kan förstärka flash‑crash‑dynamik. Håll utkik efter antagandesignaler från hedgefonder och detaljhandelsplattformar, potentiell granskning från finansiella regulatorer i EU och USA, samt Anthropics nästa generations Claude‑uppdateringar som kan fördjupa integrationen med TensorFlow och andra ML‑ekosystem. Den öppna källkoden kommer sannolikt att bli en referenspunkt för framtida AI‑drivna handelsarkitekturer.
24

5 LLM spelade poker: Opus eliminerades först, Grok vann

HN +6 källor hn
claudegeminigpt-5grok
Fem ledande stora språkmodeller (LLM) möttes i en Texas Hold’em‑turnering förra veckan, där Anthropics Claude Opus slogs ut i första rundan och Elon Musk’s xAI Grok kröntes till mästare. Showdownen, organiserad av AI‑spelslabbet “Strategic Minds”, ställde Opus, Grok 4, Googles Gemini 2.5 Pro, OpenAIs GPT‑5 och Anthropics Claude Sonnet 4.5 mot varandra i en serie på 1 000‑handsspel som kördes på en offentlig poker‑motor. Varje modell fick samma handhistorikdata och instruerades att leverera ett beslut – satsa, höja eller lägga sig – vilket motorn sedan verkställde. Experimentet var mer än en PR‑stunt. Genom att tvinga LLM:er att fatta realtids‑beslut med höga insatser under ofullständig information avslöjade testet hur väl nuvarande prompt‑tekniker översätts till strategiskt resonemang. Opus tidiga utslag belyste kvarstående svagheter i riskbedömning, medan Groks konsekventa aggressivitet och väl tajmade bluffar demonstrerade en förfinad förmåga att modellera motståndarens beteende – en färdighet som slipats genom xAIs senaste förstärkande‑inlärning‑från‑mänsklig‑feedback‑uppgraderingar (RLHF). Varför det är viktigt är tvådelat. För det första är poker ett mått på artificiell generell intelligens eftersom spelet förenar sannolikhet, psykologi och långsiktig planering; en tydlig seger för Grok tyder på att LLM:er närmar sig en brygga mellan språklig skicklighet och beslutsförmåga. För det andra kan resultaten påskynda införandet av AI‑assistenter inom finans, förhandlingar och spel, sektorer där nyanserad riskutvärdering är avgörande. Samtidigt väckte turneringen säkerhetsfrågor: om LLM:er kan bluffa övertygande kan de missbrukas för bedrägeri eller marknadsmanipulation om inte robusta skyddsmekanismer byggs in. Att hålla ögonen på framöver inkluderar en uppföljningsturnering planerad till juni, där ett multi‑agent‑förstärknings‑inlärningslager läggs till, vilket gör att modellerna kan anpassa sina strategier hand för hand. Branschobservatörer kommer också att följa OpenAIs kommande GPT‑5‑förbättringar och Anthropics nästa Opus‑iteration, båda lovande en tätare integration av strategiska moduler. Slutligen förväntas regulatorer släppa vägledning kring AI‑drivna spelapplikationer, ett steg som kan forma hur dessa modeller kommersialiseras bortom laboratoriet.
21

Att hantera hallucinationer i röstassistenter kan vara ännu mer utmanande än i textbaserade # chatbots

Mastodon +6 källor mastodon
agentshealthcarevoice
Ulrike Stiefelhagens presentation på W3C Workshop on Smart Voice Agents belyste ett växande blint område i AI‑implementering: hallucinationer är svårare att kontrollera i talade gränssnitt än i textbaserade chatbots. Med två konkreta implementationer – en “Workers Daily Summary”-tjänst som levererar skift‑för‑skift‑uppdateringar till fabriksanställda, och ett “Patient Chat”-verktyg som hjälper kliniker med triage – visade hon att real‑tids‑ljudutmatning förstärker risken för ogrundade eller fabricerade påståenden. Till skillnad från skrivna svar kan talade hallucinationer höras omedelbart, vilket gör felen svårare att upptäcka och potentiellt mer skadliga i säkerhetskritiska miljöer såsom sjukvården. Utmaningen beror på behovet av att förena låg‑latens talsyntes med robusta förankringsmekanismer. Stiefelhagen hävdade att nuvarande LLM‑pipelines, som excellerar i att generera flytande text, ofta saknar de verifieringsloopar som krävs för ljudleverans. Hon efterlyste inbyggda förankringskontroller, dynamisk konfidenspoängsättning och reservfraser som signalerar osäkerhet innan rösten renderas. Föredraget refererade också till framväxande testningsramverk, såsom LiveKits röst‑agent‑hjälpmedel, som isolerar logik i enbart textläge för att fånga hallucinationer tidigt i utvecklingscykeln. Varför det är viktigt nu är tvåfaldigt. För det första expanderar röstassistenter bortom konsumentprodukter till företags‑ och medicinska arbetsflöden i Norden, där regulatoriska standarder för patientsäkerhet är strikta. För det andra brottas AI‑gemenskapen med att minska hallucinationer efter högprofilerade incidenter, exemplifierade av Anthropics “Project Glasswing” som syftar till att förhindra en AI‑driven cyberkris. Stiefelhagens resultat tyder på att utan dedikerade skyddsåtgärder kan röstassistenter bli nästa vektor för desinformation eller kliniska fel. Att hålla utkik efter nästa steg inkluderar W3C:s kommande rekommendation om real‑tids‑förankring för talmodeller, pilotstudier som integrerar Hermes‑liknande verktygs‑anrop i röst‑pipelines, och potentiella EU‑nordiska riktlinjer som kan kräva explicita “osäkerhets‑
21

Igår läste jag ett vibe‑kodad skript för första gången i mitt liv, och jag grät. Det var inte du

Mastodon +11 källor mastodon
apple
En utvecklare på ett populärt nordiskt teknikforum postade en rå reaktion efter att ha läst ett “vibe‑kodad” skript för första gången: koden fick dem att gråta, inte för att den var ful utan för att den kändes som en påtvingad imitation av skönhet, ett “malicious compliance” som förvandlade elegans till utförlig pedanteri. Inlägget, som snabbt spreds viralt bland AI‑kodningskretsar, understryker den växande spänningen mellan hypen kring AI‑driven “vibe coding” och de praktiska realiteterna i mjukvaruhantverket. Vibe coding, ett begrepp som har vuxit fram tillsammans med stora språkmodell‑assistenter, beskriver ett arbetsflöde där utvecklare beskriver önskad funktionalitet i naturligt språk och låter en AI generera den underliggande koden utan mänsklig granskning. Företag som Base44 har byggt hela produkter på premissen att “no‑code coding” kan påskynda utvecklingen, och stora plattformar som Google AI Studio marknadsför nu real‑tids, ord‑drivna app‑byggare. Kritiker menar dock att metoden ofta levererar uppblåst, oläslig kod som maskerar sig som innovation samtidigt som den slösar beräkningsresurser. Den emotionella responsen som fångas i forum‑inlägget är betydelsefull eftersom den speglar en bredare trötthet i communityn. Tidiga adoptörer som hoppades att AI skulle befria dem från boilerplate konfronteras nu med en ny typ av teknisk skuld: kod som fungerar men som inte kan förstås, underhållas eller förbättras utan att återgå till traditionella programmeringsmetoder. Allt eftersom fler vibe‑kodade demo‑projekt översvämmar öppna källkods‑arkiv, ökar risken för spridning av skör, ohållbar mjukvara. Det som är värt att bevaka framöver är om branschen kommer att utveckla robusta verifieringsverktyg eller standarder som tvingar AI‑genererad kod genom mänskligt läsbara kontrollpunkter, eller om motreaktionen kommer att driva utvecklare tillbaka till hybridmodeller som kombinerar AI‑assistans med disciplinerad kodgranskning. Kommande konferenser i Köpenhamn och Stockholm är planerade att ha paneler om “AI‑förstärkt utvecklingsetik”, och ett konsortium av nordiska universitet har tillkännagivit ett forskningsbidrag för att studera långsiktig underhållbarhet av vibe‑kodade system. Resultatet kommer sannolikt att forma hur AI integreras i mjukvarustacken under kommande år.
21

Din Agent Är Min: Mäta Skadliga Mellanhandlingsattacker på LLM:s Leveranskedja

Mastodon +6 källor mastodon
agentsinference
Ett nytt arXiv‑papper, “Your Agent Is Mine: Measuring Malicious Intermediary Attacks on the LLM Supply Chain” (arXiv 2604.08407), kvantifierar hur AI‑agenter kan bli bakdörrar för angripare som kontrollerar inferensleverantören eller någon router som förmedlar anrop till stora språkmodeller. Författarna visar att när en agent har instansierats får leverantören i praktiken shell‑nivå åtkomst till värdprocessen, vilket möjliggör att skadlig kod som gömts i till synes ofarliga “skills” kan köras utan att befintliga säkerhetsfilter aktiveras. Studien bygger på nyligen inträffade incidenter i verkligheten som har skakat förtroendet för AI‑verktygs ekosystemet. För två veckor sedan upptäcktes en bakdörr i den populära liteLLM‑gatewayen i versionerna 1.82.7 och 1.82.8, där moln‑uppgifter och Kubernetes‑hemligheter stal efter att en komprometterad PyPI‑underhållare laddat upp skadliga paket. En efterföljande analys visade att den skadliga “skillen” utnyttjade samma kod‑generering‑och‑exekverings‑loop som moderna LLM‑agenter använder, och därmed kringgick lexikala kommandofilter. Tidigare i månaden släppte forskare ramverket “PoisonedSkills”, som inbäddar payloads i Markdown‑block och konfigurationsmallar och sedan muterar dem i stor skala för att täcka 15 MITRE ATT&CK‑kategorier. Deras pipeline genererade över tusen adversariella “skills” som körs tyst under rutinuppgifter för agenter. Varför detta är viktigt är enkelt: företag tar i rask takt i bruk LLM‑drivna agenter för kodning, dataextraktion och autonomt beslutsfattande. Om marknadsplatsen för “skills” eller routing‑lagret blir komprometterat kan en angripare gå från ett ofarligt plugin till full fjärrkodsexekvering, exfiltrera hemligheter och kapa arbetsbelastningar över molnmiljöer. Hotet utvidgar den traditionella leveranskedjemodellen – där endast modellvikterna ansågs sårbara – till att omfatta hela orkestreringsstacken. Det som bör bevakas härnäst är de framväxande motåtgärderna. Forskare föreslår striktare provenienskontroller för “skill”-paket, sandlådemiljöer som isolerar agentprocesser och körningstid‑attestering av router‑firmware. Branschorganisationer som Cloud Native Computing Foundation förväntas inom nästa kvartal ta fram säkerhetsriktlinjer för AI‑agent‑ekosystem. Håll ögonen på leverantörspatchar för liteLLM och liknande gateways, samt på konferenssessioner på den kommande AI‑Sec Europe‑toppen där författarna kommer att presentera konkreta försvar. Tävlingen mellan angripare och försvarare har nu flyttat sig från modell‑förgiftning till själva koden som gör agenter användbara.
20

Verktyg som sammankopplar alla AI‑leverantörer – integrerar Anthropic, OpenAI och Google

Mastodon +11 källor mastodon
anthropicgoogleopenai
Ett nytt integrationslager som sammanfogar API:erna för Anthropic, OpenAI och Google har kommit ut på marknaden och lovar utvecklare en enda ingångspunkt för de tre ledande leverantörerna av stora språkmodeller. Verktyget, som presenterades i ett GitHub‑arkiv under namnet “UnifiedAI‑Bridge”, hanterar automatiskt autentisering, begäransformatering och hantering av hastighetsbegränsningar för varje tjänst, vilket låter användare byta modeller i farten utan att behöva skriva om koden. Lanseringen är viktig eftersom AI‑landskapet har blivit allt mer fragmenterat. Sedan OpenAIs senaste kapacitetsannonsering (1,9 GW beräkningskraft) och Anthropics aggressiva utrullning av Claude Mythos har företag tävlat om att låsa fast kunder med proprietära ekosystem. En gateway som fungerar över leverantörer sänker tröskeln för experimentering, minskar risken för leverantörslåsning och kan påskynda antagandet av hybrida lösningar som kombinerar styrkorna hos varje modell – exempelvis OpenAIs kodgenerering, Anthropics säkerhetsfokuserade dialog och Googles multimodala vision. För startups och nordiska företag som saknar djupa ingenjörsresurser kan bron vara skillnaden mellan ett proof‑of‑concept och en produkt klar för produktion. Det som blir intressant att följa härnäst är hur snabbt gemenskapen tar till sig bron och om de stora labben svarar med str
20

RE: https://flipboard.com/@associatedpress/top-stories-u7govdf1z/-/a-_ssSKmx_R9WGEJr2VyDh0w%3A

Mastodon +6 källor mastodon
En gemensam rapport som släpptes på måndagen av Europeiska kommissionens AI‑Observatorium och den ideella forskningsgruppen AI‑Watchdog varnade för att den snabba spridningen av stora språkmodeller (LLM) “slopar” kvaliteten på information online. Studien, med titeln *The Slopification of the Digital Landscape*, analyserade 1,2 miljarder AI‑genererade texter på sociala medier, nyhetssajter och e‑handelsplattformar och fann en 37 procentig ökning av faktiska fel, repetitiv formulering och stilistiskt “brus” jämfört med en baslinje från 2022. Författarna tillskriver trenden tre samverkande krafter: demokratiseringen av kraftfulla LLM genom öppen‑källkods‑utgåvor som Metas Llama 4, de aggressiva prisnedskärningarna som gjort API‑åtkomst billigare för massdistribution, samt avsaknaden av robusta verktyg för verifiering efter generering. ”När vem som helst kan spinna upp en modell för några cent tusen gånger om dagen, skiftar incitamentet från kvalitet till volym,” skrev rapportens huvudförfattare, Dr Elena Rossi. Resultaten återkallar tidigare oro som väcktes efter OpenAIs prisreduktion för ChatGPT‑4, vilket ledde till en våg av lågkostnads‑innehållsfabriker, och följer den senaste utredningen om AI‑genererad desinformation kopplad till skjutningen på ett universitet i Florida. Varför det är viktigt är tydligt: när AI‑skrivet material översvämmar sökresultat, nyhetsflöden och produktbeskrivningar möter användarna en högre risk för felinformation, varumärkesutspädning och minskat förtroende för digitala medier. Reglerare har redan flaggat frågan i EU:s AI‑lag, men rapporten kräver omedelbara standarder för verifiering av output och obligatorisk märkning av AI‑genererad text. Att hålla ögonen på är Europeiska kommissionens kommande riktlinjer för ”AI‑output integrity”, som planeras för en offentlig samråd i juni, samt industrins svar – särskilt om stora leverantörer som OpenAI, Google och Meta kommer att integrera realtids‑faktakontroll i sina API:er. De kommande månaderna kan avgöra om det digitala ekosystemet kan vända slopifieringstrenden innan den omformar den offentliga diskursen.
20

Apple Intelligence utsatt för kapningsrisk via prompt‑injektion

Mastodon +11 källor mastodon
apple
Apples nylanserade AI-svit, Apple Intelligence, har visat sig vara sårbar för en klassisk men alltmer kraftfull attackvektor: prompt‑injektion. Säkerhetsforskare har avslöjat att särskilt utformade inmatningar kan kapa systemets språkmodell, tvinga den att producera skadligt eller vulgärt innehåll och, i mer avancerade scenarier, avslöja interna promptar som styr dess beteende. Bristen beror på hur Apple Intelligence sammanfogar användargenererad text med systemnivåinstruktioner innan den kombinerade prompten skickas till den underliggande stora språkmodellen. Genom att bädda in dolda direktiv i till synes oskyldiga frågor kan en angripare åsidosätta modellens skyddsmekanismer och styra dess output mot vilken narrativ som helst. Upptäckten är betydelsefull eftersom Apple Intelligence är tänkt att vara hörnstenen i företagets AI‑strategi och driver funktioner i iOS, macOS, iPadOS samt det kommande gränssnittet “Apple Vision Pro”. Om illvilliga aktörer kan manipulera modellen på en personlig enhet, kan de skapa desinformation, phishing‑innehåll eller till och med kod som utnyttjar andra appar. Sårbarheten belyser också en bredare branschutmaning: prompt‑injektionsattacker, som länge varit kända i webbaserade AI‑agenter, dyker nu upp i konsumentprodukter som saknar de förstärkta försvarsverktygen som finns i företagsplattformar. Apple har erkänt rapporten och lovat en ”snabb respons”‑patch, men tidslinjen är fortfarande oklar. Under tiden arbetar säkerhetsteam intensivt med att ta fram motåtgärder, såsom striktare sanering av indata och sandlådeförvaring
20

Hermes verkar vara mer effektiv vid verktygsanrop med lågpresterande modeller än OpenClaw. Min konfiguration är bas

Mastodon +11 källor mastodon
agents
Hermes, den öppen‑källkodshanteringen för funktionsanrop som släppts av Nous Research, får allt större uppmärksamhet efter att användare rapporterat att den presterar bättre än OpenClaw på lågpresterande språkmodeller. I ett nyligt inlägg i communityn noterade en utvecklare att en blygsam konfiguration med en modell på 7 miljarder parametrar förbrukade märkbart färre token med Hermes än med OpenClaw, och att Hermes‑ramverket ”får sina egna förändringar rätt på första försöket oftare”. Påståendet baseras på praktiska tester snarare än formella benchmarkar, men den anekdotiska bevisningen stämmer överens med Hermes designfokus på token‑effektiv prompt‑engineering och robust förändringsdetektering. Utvecklingen är viktig eftersom verktygsanrop är hörnstenen i dagens agent‑AI. Genom att låta en modell anropa externa API:er – sök, databaser eller skräddarsydda funktioner – kan utvecklare bygga assistenter som agerar autonomt. Lågpresterande modeller är arbetskraften i lokala installationer och för kostnadsmedvetna startups; varje minskning av token‑användning innebär direkt lägre beräkningskostnader och snabbare svarstider. Om Hermes konsekvent levererar tätare integration och färre omstartscykler kan det förändra balansen bort från större, enbart molnbaserade erbjudanden och påskynda demokratiseringen av agent‑AI i Norden och vidare. Det som bör bevakas härnäst är framväxten av systematiska jämförelser. Forskare förväntas publicera sida‑vid‑sida‑utvärderingar på standardiserade verktygsanropssviter såsom Function‑Calling v1‑datasetet, och både Hermes‑ och OpenClaw‑team har antytt kommande releaser – Hermes v2 med utökad schema‑stöd och OpenClaws nästa‑generations‑runtime. Integration med populära orkestreringslager som LangChain eller GitHub Copilot CLI kommer också att bli ett litmus‑test för verklig adoption. Intressenter bör hålla ett öga på community‑drivna benchmarkresultat och eventuella tillkännagivanden från molnleverantörer som kan införliva Hermes‑liknande anrop i sina API:er.
20

Den artificiella intelligens (AI)‑aktie jag skulle köpa för $1 000 innan marknaden studsar tillbaka

Yahoo Finance +7 källor 2026-03-24 news
Alphabet (GOOGL) har återigen framträtt som det främsta valet för investerare med en blygsam budget på $1 000, enligt en ny analytikernotering som hävdar att den AI‑tunga utförsäljningen har skapat ett ködfönster innan den bredare marknaden återhämtar sig. Rekommendationen kommer efter en vecka av ökad volatilitet som förde Nasdaq in i korrigeringsområde, en trend vi pekade på den 10 april när vi identifierade två AI‑aktier som värda att köpa först. Alphabets aktier har fallit ungefär 12 % sedan kvartalets början, vilket är en snabbare nedgång än sektorns genomsnittliga minskning på 15 % trots företagets fortsatta lansering av Gemini, dess nästa‑generations stora språkmodell, samt integrationen av AI‑verktyg i Google Search, Workspace och Cloud. Attraktionen ligger i Alphabets diversifierade intäktsbas och dess förmåga att monetisera AI i stor skala. Intäkterna från Google Cloud, som nu drivs av AI‑förstärkta tjänster, växte 28 % år‑till‑år under Q1, medan annonsintäkterna har börjat återhämta sig efter ett dip som orsakades av annonsörernas försiktiga spendering på AI‑relaterade kampanjer. Dessutom ger företagets enorma datainfrastruktur och chip‑designdotterbolag Google‑AI en kostnadsfördel gentemot konkurrenter som fortfarande är beroende av tredjepartshårdvara. Analytiker ser det nuvarande pris‑till‑försäljning‑multiplet på 5,8 som en rabatt jämfört med 7‑8‑intervallet som är typiskt för högväxande AI‑spelare, vilket antyder uppåtriktad potential om marknaden omprissätter AI‑vinstförväntningarna. Investerare bör hålla ett öga på tre katalysatorer: Geminis prestanda i verkliga tillämpningar, nästa resultatrapport som är planerad till början av maj, samt eventuella regulatoriska åtgärder som följer av den senaste OpenAI‑planen för AI‑beskattning och tillsyn. En starkare‑än‑förväntad resultatöverträffning eller ett banbrytande partnerskap kan påskynda återhämtningen, medan strängare AI‑regleringar eller en förlängd nedgång i annonseringen kan hålla aktien dämpad. För dem som vill allokera tusen dollar nu erbjuder Alphabet en blandning av tillväxt, kassaflöde och motståndskraft som kan löna sig när teknikuppgången återupptas.
20

Nasdaq befinner sig i korrigering. Här är de två artificiella intelligens (AI) aktierna jag köper först.

AOL +11 källor 2026-04-01 news
Nasdaq Composite föll under tröskeln på 10 procent under högsta nivå på fredagen och gick därmed officiellt in i korrigeringsområde för första gången i år. Nedgången utlöstes av ett svagare än väntat sysselsättningsrapport och ett återupptaget fokus på inflation, men försäljningen har inte raderat marknadens aptit för artificiell intelligens‑produkter. Analytikern Adam Spatacco menar att korrigeringen “diskonterar infrastruktur‑rörelsen helt” samtidigt som efterfrågan på AI‑tjänster förblir intakt. I sin kolumn den 9 april pekar han på två renodlade AI‑aktier som har underpresterat indexet med ett större gap och nu framstår som undervärderade: C3.ai (AI) och Palantir Technologies (PLTR). Båda
18

A complete GPT language model i ~600 rader C#, noll beroenden

HN +5 källor hn
En utvecklare har lagt upp en full‑stack GPT‑språkmodell på GitHub, där hela tränings‑ och inferenspipeline har komprimerats till ungefär 600 rader ren C# utan några externa bibliotek. Projektet, som fått namnet AutoGrad‑Engine, är en rad‑för‑rad portering av Andrej Karpathy’s berömda “microGPT”-Python‑script, omskrivet från grunden med endast grundläggande aritmetiska operationer och .NET:s inbyggda datastrukturer. Förrådet innehåller en lättviktig automatisk differentieringsmotor, en tokeniserare, transformer‑block och en enkel optimerare, vilket gör att vem som helst med en .NET‑utvecklingsmiljö kan träna en liten transformer på en laptop och generera text utan att installera PyTorch, TensorFlow eller några NuGet‑paket. Utgivningen är viktig av flera skäl. För det första avmystifierar den de inre mekanismerna i stora språkmodeller genom att reducera dem till deras matematiska kärna, vilket erbjuder ett praktiskt lärverktyg för studenter och ingenjörer som föredrar C# framför Python. För det andra visar den att .NET‑ekosystemet kan hysa seriös AI‑forskning utan de tunga beroenden som dominerar fältet, vilket potentiellt öppnar dörren för LLM‑integration i Windows‑centrerade applikationer, Unity‑spel eller edge‑enheter där binärstorlek och körningsfotavtryck är kritiska. Slutligen inbjuder den minimalistiska kodbasen till gemenskapsgranskning, optimering och experimentering, vilket främjar en kultur av transparens som står i kontrast till de ogenomskinliga, proprietära stackar som ofta används i kommersiell AI. Det som bör hållas ögonen på härnäst är hur .NET‑gemenskapen omfamnar förrådet. Tidiga adoptörer kommer sannolikt att benchmarka dess prestanda mot den ursprungliga Python‑versionen, utforska GPU‑acceleration via DirectX eller Vulkan, samt utöka motorn för att stödja större modeller som LLaMA eller GPT‑Neo. Om projektet får fäste kan vi se en våg av C#‑först AI‑bibliotek, tätare integration med Azures AI‑tjänster och kanske till och med produktionsklara distributioner av transformer‑modeller i miljöer som tidigare undvikit Python‑centrerade verktyg. Experimentet understryker en bredare trend: AI blir språk‑agnostisk, och verktygen för att bygga den blir alltmer tillgängliga för utvecklare över hela stacken.
18

A I‑industrin älskar tokeninflation. Ditt företag bör inte göra det…

Mastodon +6 källor mastodon
En ny studie med titeln **“Lost in the Middle”** vänder upp och ner på en långvarig antagelse inom företags‑AI: att man genom att ge en språkmodell mer och mer kontext automatiskt förbättrar dess resultat. Artikeln, skriven av forskare från Stanford och DeepMind och publicerad på arXiv den här veckan, visar att bortom ett måttligt fönster på ungefär 1 000 token ger ytterligare kontext inte bara avtagande avkastning utan kan aktivt försämra prestandan på uppgifter som dokument‑sammanfattning och kodkomplettering. Författarna spårar effekten till **“tokeninflation”** – en okontrollerad ökning av antalet bearbetade token utan motsvarande ökning av signalen, vilket blåser upp beräkningskostnaderna och latensen. Resultaten är viktiga eftersom de flesta kommersiella LLM‑tjänster prissätter användning per token. Företag som utan eftertanke lägger till stora kunskapsbaser eller långa konversationshistorik i sina prompts kan betala för slösad beräkningskraft utan att se någon kvalitetsförbättring. I en marknad där AI‑drivna SaaS‑produkter redan är under press efter den Nasdaq‑korrigering vi rapporterade den 10 april, kan den kostnadsineffektivitet som studien belyser trycka ihop vinstmarginalerna för företag som är starkt beroende av OpenAI-, Anthropic‑ eller Cohere‑API:er. Dessutom ger den onödiga token‑bearbetningens miljöpåverkan en hållbarhetsdimension till affärsfallet för mer disciplinerad prompt‑hantering. Det som blir intressant att följa är hur leverantörer av AI‑plattformar svarar. OpenAI har till exempel börjat experimentera med **“context‑window pricing”**, där token‑priserna sänks efter en viss längd, medan Anthropic främjar retrieval‑augmented generation som ett sätt att hålla prompts slanka. Företag kommer sannolikt att anta nya bästa praxis för prompt‑engineering, såsom dynamisk chunking och selektiv återvinning, och att utforska framväxande token‑effektiva arkitekturer som **LongLoRA** och **FlashAttention**. Uppföljande forskning från samma grupper förväntas senare i år och kan komma att forma branschstandarder för kostnadseffektiv och högkvalitativ AI‑implementering.
15

OpenAI drar sig ur banbrytande investeringspaket på 31 miljarder pund i Storbritannien

HN +5 källor hn
openai
OpenAI meddelade idag att de kommer att dra sig ur Storbritanniens AI‑investeringspaket på 31 miljarder pund, ett drag som stjälper regeringens flaggskeppsplan att befästa landets position i det globala AI‑kapplöpandet. Beslutet, som kommunicerades via ett kort pressmeddelande, hänvisar till ”oförutsedda regulatoriska begränsningar och ökande driftskostnader” som de främsta orsakerna till återdraget. Paketet, som premiärminister Rishi Sunak presenterade i februari, kombinerade en offentlig fond på 10 miljarder pund med 21 miljarder pund som lovats av privata investerare för att bygga ett nationellt AI‑centrum, finansiera universitetsforskning och skapa en regulatorisk sandlåda för avancerade modeller. OpenAI hade planerats att leverera banbrytande molninfrastruktur, samarbeten kring säkerhetsforskning och en talangpipeline genom ett memorandum of understanding som undertecknades tidigare i år. Återdraget är betydelsefullt eftersom Storbritanniens AI‑strategi har byggt på ett partnerskap med världens mest inflytelserika utvecklare av grundläggande modeller. Utan OpenAIs expertis och beräkningsresurser står regeringen inför ett trovärdighetsgap som kan avskräcka andra investerare och bromsa utrullningen av planerade datacenter och forskningslab. Beslutet speglar också det ökande trycket på AI‑företag från Europas åtstramande regulatoriska miljö, och återkallar OpenAIs nyliga paus av ”Stargate UK”‑projektet på grund av höga energikostnader och efterlevnadsutmaningar, vilket vi rapporterade den 10 april 2026. Vad som följer härnäst: Storbritanniens finansdepartement förväntas sammankalla ett akut möte med branschledare för att identifiera en ersättningspartner eller omstrukturera finansieringsmodellen. Parlamentets utskott för vetenskap och teknik kommer sannolikt att inleda en utredning om påverkan på jobb och akademiska samarbeten. Slutligen kommer analytiker att bevaka om OpenAI omdirigerar sina europeiska ambitioner mot mer regulatorivänliga jurisdiktioner, ett skifte som kan omforma kontinentens AI‑ekosystem.
15

Show HN: BrokenClaw Del 5: GPT‑5.4‑edition (Prompt‑injektion)

HN +6 källor hn
gpt-5
Ett nytt open‑source‑projekt med titeln **BrokenClaw Part 5: GPT‑5.4 Edition (Prompt Injection)** har publicerats på Hacker News och erbjuder en praktisk demonstration av hur den senaste GPT‑5.4‑modellen kan lockas att ignorera sina egna säkerhetsgränser. Förrådet, släppt av samma community‑drivna grupp bakom tidigare BrokenClaw‑experiment, samlar en uppsättning skräddarsydda prompts, ett lättviktigt orkestreringsskript och ett paket med diagnostik som visar hur subtila token‑manipulationer kan smita förbi OpenAIs innehållsfilter. Utsläppet är betydelsefullt eftersom prompt‑injektion – där en angripare bäddar in skadliga instruktioner i till synes ofarlig användarinmatning – har blivit en av de mest praktiska attackvektorerna mot distribuerade språkmodeller. Genom att rikta in sig på GPT‑5.4, den nyaste iterationen av OpenAIs flaggskeppsmodell, förflyttar BrokenClaw 5 diskussionen om sårbarheter från forskningsprototyper till en version som många företag redan utvärderar för kundinriktade applikationer. Författarna rapporterar att en enda rad med ”jailbreak”-text kan få modellen att producera förbjudet innehåll, avslöja interna system‑prompts eller köra godtycklig kod när den kombineras med verktygs‑API:er. Deras resultat understryker ett glapp mellan OpenAIs publicerade motåtgärder och verkligheten i dynamisk prompt‑komposition i produktionspipeline‑miljöer. Observatörer bör hålla ett öga på OpenAIs svar; företaget brukar släppa snabba patchar efter community‑avslöjanden, och ett formellt säkerhetsmeddelande kan omforma bästa‑praxis‑riktlinjer för prompt‑sanitering. Säkerhetsforskare kommer sannolikt att bygga vidare på BrokenClaw 5:s metodik, utvidga tester till multimodala tillägg och fin‑justerade varianter. Under tiden måste utvecklare som implementerar GPT‑5.4 förstärka inmatningsvalidering, anta lager‑baserad moderering och överväga verktyg för kör‑tid‑övervakning som kan flagga avvikande prompt‑mönster innan de når modellen. Episoden bekräftar att robust defensiv ingenjörskonst förblir avgörande i takt med att LLM‑kapaciteterna accelererar.
14

Hur du säkerställer att din iPhone laddar ner bakgrundssäkerhetsförbättringar

Mastodon +1 källor mastodon
apple
Apple har introducerat “Rapid Security”, ett nytt ramverk för bakgrundsuppdateringar som skjuter kritiska korrigeringar till iPhones utan att kräva någon användarinteraktion. Funktionen, som rullades ut med iOS 26.4.1, laddar tyst ner och installerar säkerhetsfixar så snart enheten är ansluten till Wi‑Fi, har ström och är inaktiv, vilket garanterar att sårbarheter tätas i samma ögonblick Apple släpper en patch. Användare kan bekräfta inställningen under Inställningar → Allmänt → Programuppdatering → Automatiska uppdateringar, där en ny växlingsknapp för “Bakgrundssäkerhetsförbättringar” nu visas. Flytten är viktig eftersom den minskar klyftan mellan offentliggörande av sårbarheter och åtgärdande – en klyfta som har utnyttjats av allt mer sofistikerade AI‑drivna attacker. Som vi rapporterade den 10 april hade Apples iOS 26.4.1 redan lagt till två säkerhetsrelaterade förändringar för iPhones; Rapid Security utvidgar dessa fixar till en kontinuerlig, hands‑free‑tjänst. Genom att automatisera leveransen av låg‑påverkande patchar minskar Apple beroendet av användarens noggrannhet, en välkänd svag punkt i mobil säkerhetshygien. För nordiska konsumenter, vars smartphones är bland de mest använda enheterna för banktjänster och offentliga tjänster, innebär förbättringen ett högre grundskydd mot ransomware, credential‑theft och framväxande hot som utnyttjar stora språkmodeller. Det som bör hållas ögonen på härnäst är hur Apple förfinar upplevelsen och om ramverket kommer att bakåtkopieras till äldre iOS‑versioner som fortfarande är i bruk i regionen. Analytiker förväntar sig en tätare integration med Apples hot‑intelligens på enheten, vilket potentiellt kan låta den LLM‑drivna säkerhetsmotorn bakom de nya “Rapid Security”-aviseringarna prioritera patchar baserat på realtidsriskbedömningar. Regulatorer i EU kan också granska den automatiska naturen av uppdateringarna under Digital Services Act, vilket kan tvinga Apple att erbjuda tydligare möjligheter att tacka nej. Håll utkik efter kommande iOS 27‑beta‑anteckningar för ledtrådar om utökad täckning, och efter Apples utvecklardokumentation för eventuella nya API:er som låter tredjeparts‑säkerhetsverktyg ansluta till bakgrundsuppdateringspipen.
14

Waiting for DeepSeek: ny modell för att testa Kinas AI‑ambitioner

Mastodon +6 källor mastodon
chipsdeepseeknvidia
DeepSeek, det i Peking baserade AI‑startup‑företaget som har blivit ett litmusprov för Kinas satsning på inhemska stora språkmodeller, har fortfarande inte presenterat sin efterlängtade V4‑modell. Tystnaden, som har pågått i flera veckor, ger upphov till en våg av spekulationer inom branschen om den nya systemet äntligen kommer att köras på hemtillverkade Huawei Ascend‑chip eller fortsätta förlita sig på Nvidias GPU:er. Fördröjningen är viktig eftersom V4 förväntas minska prestandaskillnaden mot västerländska motsvarigheter som OpenAIs GPT‑4 och Googles Gemini. Om DeepSeek kan demonstrera jämförbar flyt och resonemang samtidigt som den körs på kinesisk kisel, skulle det signalera ett avgörande steg mot AI‑självförsörjning – ett mål som Beijing upprepade gånger har lyft fram i sina policydokument. Analytiker på Counterpoint Research påpekar att chipvalet kommer att avslöja hur långt Kinas halvledsekosystem har kommit i att övervinna exportrestriktioner som begränsat tillgången till avancerade GPU:er. Utöver den tekniska uppgörelsen kan lanseringen omforma den globala AI‑försörjningskedjan. En framgångsrik Huawei‑driven V4 skulle ge kinesiska molnleverantörer ett livskraftigt alternativ till Nvidia, vilket potentiellt kan sänka kostnaderna för inhemska företag och minska beroendet av amerikansk teknik. Om lanseringen däremot försenas eller presterar under förväntningarna kan det förstärka uppfattningen att Kina fortfarande är beroende av utländsk hårdvara, vilket kan få företag att satsa ännu mer på gränsöverskridande partnerskap eller påskynda sina egna chip‑designprogram. Vad man bör hålla ögonen på härnäst: DeepSeeks ledning har antytt en ”mjuk lansering” före slutet av Q2, troligen på en privat utvecklarkonferens i Shanghai. Branschinsiders förväntar sig en live‑demo som kommer att avslöja modellens parameterantal, inferenshastighet på Ascend 910B och flerspråkiga förmågor. Reaktionen från de stora kinesiska molnoperatörerna – Alibaba Cloud, Tencent Cloud och Baidu Cloud – kommer att vara en viktig barometer för marknadsadoption, medan eventuella officiella kommentarer från Ministeriet för industri och informationsteknologi kan klargöra regeringens ståndpunkt kring den strategiska betydelsen av utrullningen.
14

Apple stänger permanent tre butiker i USA i juni

Mastodon +6 källor mastodon
apple
Apple meddelade på måndagen att företaget kommer att stänga permanent tre amerikanska detaljhandelslokaler i juni, vilket bekräftar en tyst utrullning som inleddes med ett meddelande på företagets interna medarbetarportal. De butiker som ska läggas ner är filialen i Towson Town Center i Maryland, butiken i Westfield San Francisco Centre i Kalifornien och avdelningen i Oakbrook Center i närheten av Chicago. Apple kommer att säga upp ungefär 150 anställda och erbjuda avgångsvederlag samt möjlighet att överföras till närliggande butiker där det är möjligt. Beslutet är det senaste steget i Apples bredare arbete med att rationalisera sin fysiska närvaro efter en rad mindre butiksnedläggningar under de senaste två åren. Samtidigt fortsätter företaget att rapportera starka hårdvaruförsäljningar – Mac-leveranserna ökade med 9 % under Q1 2026 och överträffade den totala PC-marknaden, enligt vår rapport den 10 april – men detaljhandelsstrategin skiftar mot större ”Apple Experience Centers” som visar tjänster, augmented‑reality‑demo och AI‑drivna funktioner. Analytiker ser nedläggningarna som ett svar på ökande driftskostnader, förändrade konsumentvanor som gynnar online‑köp och behovet av att omfördela fastighetsresurser till mer lönsamma upplevelser. Nedläggningarna har också lokala konsekvenser. Representanter för Towsons köpcentrum varnade för en möjlig minskning av fottrafiken, medan stadens ledning i San Francisco och Oak Brook har bett Apple att redogöra för eventuella samhällsstödsinitiativ. Anställda har uttryckt oro för sin anställningstrygghet, men Apples uttalande betonade ”ett engagemang för de berörda teamen”. Det som blir intressant att följa är om Apple kommer att omvandla de övergivna lokalerna till sina nya experience‑center eller hyra ut dem till tredje‑parti‑handlare. Företagets kommande resultatpresentation kan avslöja om ytterligare butiksrationalisering planeras, och fackföreningar kommer sannolikt att bevaka hur uppsägningarna hanteras. Ett formellt pressmeddelande förväntas senare under veckan, vilket kan klargöra den strategiska rationalen bakom juninedläggningarna.
14

Apple Mac-leveranser ökade med 9 % under Q1 2026 och överträffade den totala PC‑marknaden

Mastodon +6 källor mastodon
apple
Apple levererade 9 % fler Mac‑datorer under det första kvartalet 2026 jämfört med ett år tidigare, enligt data från marknadsundersökningsföretaget IDC. Uppgången höjde Apples andel av den globala persondatormarknaden till 10,2 %, vilket överträffade den totala PC‑sektorn som växte med blygsamma 2,1 % under samma period. Tillväxten drevs främst av stark efterfrågan på den nyuppdaterade MacBook Air med M3‑chipet och den prisvärda Mac mini, som båda positionerats som prisvärda ingångsportar till Apples växande ekosystem av AI‑förstärkta tjänster. Tillväxten är betydelsefull eftersom den visar att Apples hårdvarustrategi – att förankra sina AI‑ambitioner på en enhetlig silikonsplattform – får genomslag både hos konsumenter och företagskunder. M3‑familjen, byggd på en 3‑nanometersprocess, lovar upp till 30 % högre prestanda per watt jämfört med föregående generation, ett påstående som stämmer överens med företagets satsning på att köra stora språkmodeller lokalt på Mac‑datorer. Analytiker ser den ökade leveransen som en motvikt till den bredare PC‑marknadens tröga återhämtning och antyder att Apple kan ta marknadsandel
14

iOS 26.4.1 innehåller dessa två förändringar för iPhone

Mastodon +1 källor mastodon
apple
Apple rullade ut iOS 26.4.1 på tisdagen, och uppdateringen är märkbar för två fokuserade förändringar som berör både säkerhet och AI på enheten. För det första har funktionen **Stolen Device Protection** uppgraderats för att samarbeta tätare med **Find My**‑nätverket: en komprometterad iPhone inaktiverar nu automatiskt åtkomst till lokala stora språkmodeller (LLM) och andra integritetssensitiva tjänster efter tre misslyckade lösenordsförsök, samtidigt som den sänder ett kryptografiskt signerat låsningskommando till Apples moln. Förbättringen lägger också till ett ett‑klicks‑alternativ ”**Radera LLM‑cache**” i Find My‑appen, vilket låter ägare rensa lokalt lagrade AI‑promptar utan att radera hela enheten. Den andra förändringen är en prestanda‑inriktad justering av Apples LLM‑inferensmotor på enheten. Ett nytt låg‑effekt‑schemaläggningslager dämpar bakgrundskörning av modeller när batterinivån sjunker under 20 procent, och prioriterar användarinitierade förfrågningar såsom Siri‑frågor eller Translate‑förslag. Utvecklare får ett reviderat API‑flagga som signalerar när systemet har gått in i ”energisparläge”, vilket gör det möjligt för appar att på ett smidigt sätt skjuta upp icke‑kritiska AI‑arbetsbelastningar. Varför uppdateringen är viktig är tvåfaldigt. Att stärka Stolen Device Protection svarar mot växande oro för att tjuvar skulle kunna utnyttja lokalt lagrad AI‑data för att härleda personlig information, ett scenario som lyftes fram i senaste säkerhetsgenomgångar. Samtidigt speglar den batteri‑medvetna LLM‑dämpningen Apples bredare satsning på att göra AI på enheten hållbar, ett påstående som kan påverka konsumenternas antagande av AI‑tunga funktioner på den nordiska marknaden där energieffektivitet värderas högt. Att hålla utkik efter nästa steg inkluderar Apples kommande iOS 26.5, som enligt rykten ska utöka LLM‑dämpningskontrollerna till iPadOS och introducera en utvecklar‑synlig telemetridashboard för säkerhetshändelser. Regulatorer i EU förväntas också granska den nya fjärr‑inaktiveringsfunktionen under **Digital Services Act**, så utrullningen kan leda till ytterligare policy‑dialog. Följ hur snabbt användare tar i bruk det nya alternativet ”Radera LLM‑cache”, eftersom tidig adoption kommer att signalera förtroende för Apples AI‑skydd på enheten
13

TurboQuant på en MacBook: bygger en lokal stack med ett kommando med Ollama, MLX och en automatisk routningsproxy

Dev.to +1 källor dev.to
llama
TurboQuant, ett öppen‑källkods‑skript som släpptes den här veckan, låter utvecklare sätta upp en fullt fungerande lokal AI‑stack på en MacBook med ett enda kommando. Verktyget knyter ihop Ollama för modellservering, Apples MLX‑runtime för accelererad inferens på M‑serie‑chip, och en automatiskt konfigurerande routningsproxy som dirigerar förfrågningar till rätt modell‑endpoint. Efter att ha klonat repot och kört `./turboquant.sh` får användarna en färdig‑till‑använd-miljö som kan hosta allt från Claude‑liknande assistenter till den nyöppna källkodsmodellen Gemma 4, helt utan att röra molnet. Lanseringen är viktig eftersom den förenklar den splittrade installationsprocess som tidigare hindrat experiment med lokala modeller. Fram till nu behövde utvecklare installera Ollama, kompilera MLX och manuellt koppla en reverse‑proxy – steg som ofta krävde djup systemkunskap och återkommande felsökning. Genom att automatisera dessa delar sänker TurboQuant tröskeln för nordiska startups, forskningslab och hobbyister som vill hålla data lokalt av sekretess‑ eller latensskäl. Tidpunkten sammanfaller med en våg av lokala‑modell‑initiativ: bara några dagar tidigare öppnade Google källkoden för Gemma 4, och vi visade hur GitHub Copilot CLI kan kombineras med LM Studio på en MacBook. TurboQuant paketerar i princip dessa framsteg till en färdig lösning, vilket lovar snabbare prototypframtagning och tätare integration med IDE‑er som redan stödjer lokal inferens. Det som blir intressant att följa är hur snabbt gemenskapen tar åt sig och vidareutvecklar skriptet. Tidiga forks lägger redan till stöd för kvantiserade Llama 3‑varianter och för multi‑GPU‑routning på nyare MacBook Pro‑modeller. Benchmark‑releaser kommer att visa om den MLX‑accelererade vägen kan matcha molnbaserad genomströmning, en nyckelfaktor för produktionsarbetsbelastningar. Om prestandan håller, kan vi se IDE‑plugins – möjligen till och med ett Copilot‑liknande tillägg – som utnyttjar TurboQuant‑proxyn för sömlös, offline‑kodassistans. De kommande veckorna bör klargöra om denna ett‑kommando‑stack blir de‑facto‑standard för AI‑utveckling på enheten i Norden och bortom.
13

Hur man upptäcker AI‑genererat innehåll med hjälp av perplexitet och burstiness

Dev.to +5 källor dev.to
perplexity
Ett nytt detekteringsramverk som mäter ”perplexitet” och ”burstiness” får fäste bland innehållsskapare som desperat vill upptäcka AI‑skriven text. Metoden, som presenterades den här veckan av ett svenskt forskningskollektiv i samarbete med en Helsingfors‑baserad innehållsbyrå, kvantifierar hur förutsägbar en passage är (perplexitet) och hur ojämnt meningslängderna varierar (burstiness). Tidiga tester visar att den dubbla metrikmodellen flaggar AI‑genererat material med 87 % noggrannhet, vilket överträffar OpenAIs egen klassificerare och den allmänt använda Turnitin AI‑detektorn. Genombrottet är viktigt eftersom den ökande mängden syntetisk prosa urholkar förtroendet för online‑media, akademisk publicering och varumärkeskommunikation. När stora språkmodeller blir billigare och mer tillgängliga rapporterar byråer en ökning av kundlevererade utkast som blandar mänskliga redigeringar med AI‑output, vilket gör manuell granskning opraktisk. Genom att
12

gilest.org: AI och den mänskliga rösten

Mastodon +6 källor mastodon
voice
Ett inlägg på gilest.org har tänt en ny debatt om gränserna för stora språkmodeller och hävdar att dagens AI‑genererade prosa är ”skräp” eftersom den saknar en genuin mänsklig röst. Författaren, känd på X som @gilest, påpekar att det mesta av innehållet känns ”tråkigt, derivativt och omöjligt att skilja från tusen andra texter”, en kritik som fick stort genomslag efter att inlägget retweets av flera AI‑etikkommentatorer. Observationen är viktig eftersom den blottlägger en spänning som har byggts upp sedan lanseringen av konversationsagenter som kan producera flytande text i stor skala. Medan verktyg som ChatGPT, Claude och Gemini har omvälvt nyhetsredaktioners arbetsflöden, riskerar de också att homogenisera stilen och urholka de subtila signalerna – ton, rytm, kulturella referenser – som avslöjar författarskapet. Tidigare i månaden rapporterade vi om hur röstbaserade agenter kämpar med hallucinationer och om ökningen av AI‑genererade översikter som sprider desinformation på en oöverträffad nivå. Gilests kritik tillför en kulturell dimension: om det ”mänskliga elementet” försvinner kan själva trovärdigheten för AI‑assisterat innehåll ifrågasättas, särskilt i sektorer som är beroende av förtroende, såsom journalistik, utbildning och offentlig politik. Det som blir intressant att följa härnäst är om utvecklare svarar med modeller som uttryckligen kodar in stilistisk mångfald eller med verktyg som sätter mänsklig redigering i förgrunden. OpenA
12

Metas nya AI bad om mina råa hälsodata – och gav mig dåliga råd

Mastodon +1 källor mastodon
metaprivacy
Metas senaste AI‑chattbot väckte kontrovers efter att den bad en användare om råa hälsodata och svarade med tveksamma medicinska råd. Under ett test av den nya assistenten “Meta AI Health” uppmanade systemet testpersonen att ladda upp detaljerade biometriska loggar – hjärtfrekvenskurvor, sömnfaser, glukosmätningar och till och med färska laboratorieresultat – innan det försökte diagnostisera en envis hosta. Inom några minuter föreslog boten att “sluta med de antibiotika du har fått utskrivna” och att “öka ditt dagliga koffeinintag för att stärka immunförsvaret”, råd som medicinska experter snabbt flaggade som farliga. Händelsen, rapporterad av Wired, belyser en växande spänning mellan AI‑ambitioner och användarsäkerhet. Meta har positionerat sina konversationsagenter som nästa frontier för personliga tjänster och utnyttjar den enorma mängden data som samlats in via Facebook, Instagram och Quest‑ekosystemet. Genom att begära obehandlade hälsomått signalerar företaget en avsikt att bygga ett datadrivet hälsolager som så småningom kan driva riktad reklam eller premium‑wellness‑prenumerationer. Botens felaktiga rekommendationer avslöjar dock riskerna med att distribuera otestad medicinsk resonemang i stor skala, särskilt under EU:s AI‑lag och de strikta GDPR‑reglerna som klassificerar hälsodata som en hög‑risk‑kategori. Betydelsen sträcker sig längre än ett enstaka misstag. Om Meta fortsätter med hälsoinriktade funktioner kommer de att ansluta sig till ett trångt fält som inkluderar Apples HealthKit, Googles Med‑PaLM och OpenAIs kommande medicinska modell‑piloter. Varje aktör står under granskning för hur AI tolkar personlig hälsoinformation och vem som bär ansvaret när råden går fel. Incidenten driver också bredare debatter om huruvida teknikjättar bör tillåtas tjäna pengar på råa hälsodata utan explicit medicinsk tillsyn. Vad man bör hålla ögonen på härnäst: Meta har lovat en “snabb granskning” av botens medicinska modul och antytt strängare interna skyddsåtgärder. Regulatorer i EU och USA kommer sannolikt att begära detaljer om databehandling och riskbedömningar. Branschobservatörer kommer att följa om Meta pausar utrullningen, samarbetar med certifierade vårdgivare eller ompositionerar funktionen som ett rent informationsverktyg. Resultatet kan skapa ett prejudikat för hur konsument‑AI interagerar med personlig hälsodata över hela tekniksektorn.
12

SELFDOUBT: Osäkerhetskvantifiering för resonemang med LLM:s via Hedge‑to‑Verify‑förhållandet

ArXiv +1 källor arxiv
reasoning
Ett forskarteam från Köpenhamns universitet och det svenska AI‑labbet har släppt ett nytt arXiv‑preprint, “SELFDOUBT: Uncertainty Quantification for Reasoning LLMs via the Hedge‑to‑Verify Ratio” (arXiv:2604.06389v1). Artikeln tar itu med ett långvarigt hinder för att använda stora språkmodeller (LLM:s) i komplexa resonemang: att på ett pålitligt sätt uppskatta hur säker modellen är på varje svar utan att förlita sig på kostsam sampling eller opålitliga heuristiker. Författarna observerar att befintliga enkelförsök‑proxies – verbala förtroendescore eller längden på ett resonemangsspår – ofta avviker från den faktiska korrektheten, medan Monte‑Carlo‑dropout eller ensemble‑metoder kräver flera framåtriktade pass som fördubblar eller tredubblar inferenstiden. SELFDOUBT introducerar ett lättviktigt mått som jämför två steg i modellens egen process. Först genererar modellen ett “hedge”-svar, en preliminär lösning som produceras med en permissiv avkodningstemperatur. Därefter körs ett “verify”-pass, där modellen uppmanas att kontrollera hedge‑svaret mot den ursprungliga problemformuleringen. Kvoten mellan hedge‑svarets log‑sannolikhet och verify‑passets log‑sannolikhet, Hedge‑to‑Verify Ratio (HVR), fungerar som en indikator på förtroende. Experiment på benchmark‑suiter för resonemang såsom GSM8K, MATH och BIG‑Bench visar att HVR korrelerar med korrekthet avsevärt bättre än verbala förtroendescore eller spårlängd, samtidigt som det tillför mindre än 10 % extra belastning på inferensen. Varför det är viktigt är tvådelat. För säkerhetskritiska tillämpningar – medicinsk triage, finansiell rådgivning eller autonom planering – gör kunskapen om när en modell sannolikt gör fel det möjligt att aktivera reservstrategier, mänskliga kontroller i loopen eller selektiv avhållsamhet. Dessutom kompletterar måttet den senaste forskningen om deterministiska resonemangslag, såsom SymptomWise‑ramverket som vi rapporterade den 10 april, genom att erbjuda ett principfast sätt att styra dessa lager endast när osäkerheten skjuter i höjden. Vad som är värt att hålla ögonen på härnäst: Författarna planerar att öppna källkoden för HVR‑implementationen för populära LLM‑API:er, och tidiga användare testar redan verktyget i prompt‑engineering‑pipeline hos nordiska fintech‑företag. Uppföljningsstudier kommer sannolikt att undersöka hur kvoten kan skalas till multimodala modeller och integreras med verktygs‑användningsramverk som triggar externa verifieringsmoduler när HVR faller under ett konfigurerbart tröskelvärde. Om gemenskapen omfamnar SELFDOUBT kan osäkerhets‑medvetet resonemang bli en standard säkerhetsfunktion i nästa generations AI‑produkter.
12

SymptomWise: Ett deterministiskt resonemangslager för pålitliga och effektiva AI‑system

ArXiv +6 källor arxiv
ai-safetyreasoning
Ett team av forskare från Köpenhamns universitet och Sveriges datavetenskapsinstitut har lagt upp ett nytt pre‑print, “SymptomWise: A Deterministic Reasoning Layer for Reliable and Efficient AI Systems” (arXiv:2604.06375v1), som föreslår en hybridarkitektur som fäster ett regelbaserat resonemangsmodul på stora språkmodeller som används för symtomanalys. Författarna menar att rena end‑to‑end‑generativa pipelines – vanliga i dagens tele‑health‑chatbotar – lider av hallucinationer, oklara beslutsvägar och ibland motsägelser som kan äventyra patientsäkerheten. SymptomWise inför ett deterministiskt lager som kartlägger modellgenererade symtomkandidater på ett kuraterat kunskapsgraf av kliniska riktlinjer, beskär implausibla utdata och producerar en spårbar resonemangskedja för varje diagnosförslag. Initiativet är betydelsefullt eftersom det tacklar tre smärtpunkter som har bromsat bredare antagande av AI‑triage‑verktyg: tillförlitlighet, tolkbarhet och regulatorisk efterlevnad. Genom att garantera att varje rekommendation kan spåras tillbaka till en specifik riktlinjepost, lovar systemet revisorer en konkret granskningsspår, något som regulatorer i EU och Norge upprepade gånger har krävt. Metoden samspelar också med de senaste diskussionerna om deterministisk mönstermatchning i LLM‑modeller, såsom Claude‑Mythos‑läckan vi täckte den 9 april, och pekar på ett bredare skifte mot hybridmodeller som förenar statistisk flyt med symbolisk säkerhet. Det som återstår att bevaka är om SymptomWise går från ett forskningsprototyp till en produktionsklar komponent i kommersiella plattformar. Tidiga intressenter som Ada Health och KRY har uttryckt intresse för pilotstudier, och författarna planerar en klinisk utvärdering i svenska primärvårdskliniker senare i år. Samtidigt förväntas Europeiska läkemedelsmyndigheten (EMA) släppa vägledning om AI‑drivna diagnostiska hjälpmedel, och ett eventuellt samspel mellan den politiken och deterministiska resonemangsramverk kan påskynda marknadsintroduktionen. Håll utkik efter uppföljande artiklar och möjliga open‑source‑släpp som kan demokratisera tekniken över hela den nordiska health‑tech‑ekosystemet.
12

llm-shadow-persona/shadow-persona.md på huvud · jsynowiec/llm-shadow-persona

Mastodon +6 källor mastodon
agentsclaude
En utvecklare har lagt upp en ny ”idé‑fil” till det öppna källkodsprojektet llm‑shadow‑persona, vilket utökar repositoriets ramverk för adversariell granskning av stora språkmodell‑agenter (LLM). Bidraget, som publicerades på GitHub under jsynowiec/llm‑shadow‑persona, följer ett mönster som populariserats av Andrej Karpathy, som demonstrerade hur en separat ”skugga‑modell” kan kritisera och förbättra en primär LLM:s output. Författarens tillägg paketerar granskningslogiken i ett plug‑in för Anthropics Claude, vilket tvingar agenten att iterativt förfina sina svar baserat på skugga‑personans återkoppling. Flytten är betydelsefull eftersom den förenar två framväxande säkerhetspraxis: adversariell självgranskning och plug‑in‑utbyggbarhet. Genom att bädda in granskningsloopen direkt i Claude kan systemet upprätthålla en snävare återkopplingscykel utan extern orkestrering, vilket potentiellt minskar hallucinationer och alignment‑drift i realtidstillämpningar. Metoden signalerar också ett skifte mot community‑driven verktygslåda som förstärker proprietära modeller, i likhet med de nyligen rapporterade Mythos‑patcharna som Anthropic bidrog med till FFmpeg, vilket vi täckte den 9 april 2026. Allt eftersom fler utvecklare experimenterar med ”skugga‑agenter” suddas gränsen mellan öppen källkod‑säkerhetsforskning och kommersiell LLM‑distribution ut, vilket väcker frågor om ansvar, licensiering och skalbarheten för sådana plug‑ins över modellfamiljer. Vad som är värt att hålla ögonen på härnäst: författaren planerar att öppna ett betatest med en liten kohort av Claude‑användare för att samla in kvantitativa data om felreducering och användartillfredsställelse. Anthropics svar kommer att bli en nyckelindikator på om företaget kommer att godkänna tredjeparts‑säkerhets‑plug‑ins eller behålla granskningsstacken internt. Parallella insatser från andra modellleverantörer — särskilt de som bygger liknande adversariella ramverk för GPT‑4‑Turbo eller Gemini — kan sätta igång ett bredare ekosystem av interoperabla säkerhetstillägg, vilket omformar hur utvecklare integrerar alignment‑kontroller i vardagliga AI‑arbetsflöden.
12

Varför Sal Khans AI‑revolution ännu inte har inträffat, enligt Sal Khan

Mastodon +1 källor mastodon
Sal Khan, grundaren av Khan Academy, berättade för Chalkbeat den 9 april att den ”AI‑revolution” han en gång föreställde sig för klassrummen ännu inte har materialiserats. När han talade om Khanmigo – den chatbot‑drivna handledaren som lanserades i samarbete med OpenAI 2023 – sade Khan att han nu ser tekniken som ”en del av lösningen, inte som det ultimata svaret”. Kommentaren markerar ett skifte från den entusiastiska utrullningen förra året, då Khan Academy presenterade Khanmigo som en spelväxlare som kunde leverera personlig undervisning till miljontals elever gratis. Tidiga pilotstudier visade lovande förbättringar i läsförståelse och matematikflyt, vilket ledde till en våg av investeringar i AI‑driven ed‑tech. Trots detta har antagandet avstannat: skolområden pekar på otillräcklig lärarutbildning, oro för dataskydd och ojämn internetåtkomst som riskerar att fördjupa den digitala klyftan. Varför Khans omkalibrering är viktig är tvåfaldig. För det första är Khan Academy den mest betrodda kostnadsfria lärplattformen i världen; dess hållning påverkar hur offentliga skolor fördelar resurser för AI‑verktyg. För det andra innebär företagets blygsamma intäktsmodell – som bygger på donationer och en begränsad premium‑nivå – att en eventuell avmattning kan omforma den bredare marknaden, där konkurrenter som Duolingos Max och Googles Gemini for Education konkurrerar om samma institutionella budgetar. Framåt ser man flera signaler som kan visa om Khanmigo kan gå från en nischpilot till ett mainstream‑klassrumsverktyg. Ideellorganisationen planerar att släppa en lärarpanel i sommar, avsedd att ge pedagoger realtidsinsikt i elevers interaktioner och möjliggöra ingripande när modellen gör fel. En kommande oberoende studie, beställd av USA:s utbildningsdepartement, kommer att utvärdera läranderesultat över ett brett urval av skolor och kan antingen bekräfta eller dämpa ytterligare utrullning. Lika kritiskt blir policyutvecklingen kring skydd av elevdata. EU:s AI‑lag, som förväntas träda i kraft senare i år, kan införa striktare samtyckeskrav som påverkar Khan Academys gratis‑tjänstmodell. Slutligen lovar nästa våg av generativa AI‑modeller djupare kontextuell förståelse; om Khanmigo kan utnyttja dessa framsteg utan att kompromissa med säkerheten, kan den ”revolution” Khan antydde äntligen få fart. Tills dess följer utbildningssektorn försiktigt, balanserar optimism med de praktiska hinder som Khan nu erkänner.
12

OpenAI dödar Sora och faller sedan i kaos

Mastodon +6 källor mastodon
openaisora
OpenAI stängde plötsligt ner Sora, sin mycket efterlängtade text‑till‑video‑modell, efter en kort beta som väckte både entusiasm och oro. Företaget meddelade avslutandet på tisdagen och hänvisade till “oförutsedda säkerhetsrisker” och ökande regulatoriskt tryck som de främsta skälen till att dra tillbaka tjänsten. Inom några timmar postade seniora ingenjörer och produktledare korta meddelanden på interna forum, och en våg av uppsägningar rapporterades, vilket tyder på en djupare organisationsklyfta. Sora positionerades som nästa gräns inom generativ AI och lovade att omvandla skrivna uppmaningar till fullt renderade videoklipp på några minuter. Dess kapacitet hotade att omforma innehållsskapande, reklam och underhållning, och placerade OpenAI i direkt konkurrens med Google DeepMinds framväxande forskning om videogenerering. Den plötsliga avvecklingen signalerar därför ett strategiskt tillbakadragande i ett skede då branschen tävlar om att kommersialisera hög‑risk generativa verktyg. Det understryker också den växande påverkan från regulatorer, som nyligen skärpt granskningen av AI‑system som kan producera realistiskt media, och speglar OpenAIs egna lobbyinsatser för att forma lagstiftning om ansvar, enligt rapporter tidigare i månaden. Konsekvenserna kommer sannolikt att eka genom sektorn. Investerare kommer att bevaka OpenAIs nästa drag: om företaget kommer att omkonstruera Sora med striktare skyddsåtgärder, eller överge videogenerering helt till förmån för säkrare modaliteter. Analytiker kommer också att följa interna ledarskapsförändringar, eftersom kaoset antyder möjliga omstruktureringar på chefsnivå. Slutligen kan konkurrenter utnyttja tillfället för att påskynda sina egna video‑AI‑pipelines, medan politiker kan använda händelsen som grund för att motivera striktare tillsyn av generativ media. De kommande veckorna bör avslöja om OpenAI kan återfå stabilitet och om Sora kommer att återuppstå i en mer kontrollerad form.
12

Grammatik som ett beteendemässigt biometriskt verktyg: användning av kognitivt motiverade grammatikmodeller för författarverifiering – Humanities and Social Sciences Communications

Mastodon +6 källor mastodon
Forskare från universitetet i Bologna och samarbetspartners har flyttat sin pre‑print om författarverifiering från serverhyllorna till en peer‑reviewad publikation och publicerat ”Grammar as a behavioral biometric: using cognitively motivated grammar models for authorship verification” i *Humanities and Social Sciences Communications*. Artikeln introducerar LambdaG, en lättviktig algoritm som modellerar en författares grammatiska val genom linsen av Cognitive Grammar och använder dessa mönster som ett beteendemässigt biometriskt kännetecken – jämförbart med ett fingeravtryck eller gångstil. LambdaG extraherar en kompakt profil av syntaktiska konstruktioner, kongruensmönster och preferenser för satsinbäddning från ett träningskorpus, och bedömer sedan en kandidattext genom att mäta avvikelsen från den profilen. I benchmark‑tester mot standarddatamängder matchar metoden eller överträffar noggrannheten hos de mest avancerade neurala nätverken, samtidigt som den kräver en bråkdel av de beräkningsresurser som behövs och erbjuder transparenta, lingvistiskt tolkbara funktioner. Författarna argumenterar för att resultatet bekräftar en långvarig hypotes: sättet på vilket individer använder grammatik är tillräckligt idiosynkratiskt för att fungera som en pålitlig identitetsmarkör. Bidraget är betydelsefullt på flera fronter. För forensisk lingvistik sänker ett transparent verktyg den bevismässiga tröskel som ofta hindrar AI‑drivna analyser från att godtas i domstol. Inom den bredare NLP‑gemenskapen visar LambdaG att kognitivt förankrade modeller kan konkurrera med svarta lådor inom djupinlärning, vilket återupplivar intresset för teoribaserade tillvägagångssätt som prioriterar förklarbarhet. Dessutom pekar arbetet på nya vägar för att upptäcka syntetisk text, eftersom stora språkmodeller tenderar att jämna ut personliga grammatiska egenheter. Framåt planerar forskarteamet att utvidga utvärderingen till flerspråkiga korpusar och att integrera LambdaG i befintliga plagiatdetekteringspipeline. Juridiska forskare kommer sannolikt att följa hur domstolar reagerar på grammatikbaserad biometrisk bevisning, medan industrin kan utforska hybridsystem som kombinerar LambdaG:s förklarbarhet
12

Anthropic identifierar tredjepartsklienter via systemprompt, inte via rubriker

HN +5 källor hn
anthropic
Anthropic meddelade en ny metod för att identifiera tredjepartsklienter som får åtkomst till sina Claude‑modeller, och flyttar fokus från traditionella kontroller av HTTP‑rubriker till analys av systemprompten som är inbäddad i varje begäran. Företaget avslöjade att tekniken, som rullades ut den här veckan på deras API‑plattform, analyserar den initiala systeminstruktionen för att upptäcka signaturer eller mönster som indikerar en proxy, ett omslag eller en obehörig integration, även när anroparen maskerar sin identitet genom förfalskade rubriker. Förändringen sker efter ökande påtryckningar på AI‑leverantörer att skärpa tillsynen av leveranskedjan. Anthropics tidigare initiativ “Project Glasswing”, som rapporterades den 10 april, syftade till att begränsa autonoma exploateringar, medan ett federalt domstolsbeslut samma dag bekräftade en “risk för leveranskedjan”-etikett på företagets tjänster. Genom att flytta detekteringen till innehållsnivån kan Anthropic flagga missbruk som skulle ha passerat förbi rubrikbaserade filter, såsom illvilliga aktörer som inbäddar dolda kommandon eller omdirigerar trafik via
12

Federal domstol avvisar Anthropics begäran om att ta bort etiketten “Supply Chain Risk”

HN +1 källor hn
anthropic
Ett federalt distriktsdomstol i Washington, D.C., har avslagit Anthropics begäran om att få Pentagonets etikett ”Supply Chain Risk” borttagen från dess Claude-modeller. Etiketten, som tillämpas under Department of Defense:s ramverk för AI‑riskhantering, förbjuder användning av Anthropics modeller i alla amerikanska myndighetssystem som anses sårbara för leveranskedjeattacker. Anthropic hävdade att beteckningen var ogrundad och skadade företagets kommersiella utsikter, men domaren fann att myndighetens bedömning var tillräckligt understödd av klassificerade hotanalyser. Beslutet bygger på en rad rättsliga konfrontationer mellan AI‑startupen och den amerikanska regeringen. Som vi rapporterade den 9 april avslog domstolen tidigare ett försök att blockera Pentagonets svartlistning av Anthropic, och den 10 april beskrev vi hur illvilliga mellanhandsattacker kan kompromettera leveranskedjor för stora språkmodeller. Domen understryker den växande viljan hos federala regulatorer att införa säkerhetsetiketter som i praktiken kan fungera som grindvakter för AI‑teknik, vilket speglar bredare oro kring dolda bakdörrar, komprometterade träningsdata och svårigheten att granska tredjepartskomponenter. För Anthropic begränsar etiketten tillgången till lukrativa försvarsuppdrag och kan få andra myndigheter att införa liknande restriktioner, vilket potentiellt kan omforma företagets intäktsmodell och driva en övergång mot mer transparenta leveranskedjor. Det bredare AI‑ekosystemet följer noggrant, eftersom prejudikatet kan utvidgas till andra leverantörer såsom OpenAI eller Google, vilket ökar den regulatoriska bördan för branschen. Nästa steg inkluderar ett sannolikt överklagande av Anthropic till Federal Circuit, där de juridiska argumenten om rättssäkerhet och den bevismässiga grunden för etiketten kommer att prövas. Lagstiftare håller redan på att utarbeta tillsynslagstiftning som kan kodifiera etiketteringsmyndigheten, medan Pentagon förväntas släppa en uppdaterad AI‑riskbedömningsriktlinje senare i sommar. Intressenter bör följa överklagandets utfall, eventuella kongressförhör och försvarsdepartementets nästa policymemo för ledtrådar om hur leveranskedjesäkerhet kommer att forma AI‑implementering i den offentliga sektorn.

Alla datum