AI News

503

DeepSeek söker extern kapital för att behålla AI‑talanger

Mastodon +7 källor mastodon
deepseekfundingstartup
DeepSeek, det Shanghai‑baserade AI‑företaget känt för sin storskaliga språkmodell som konkurrerar med OpenAI:s ChatGPT, förbereder sig för att öppna sitt kapital för externa investerare, enligt en insiderrapport citerad av Yicai Global. Initiativet ses mindre som en ren kapitalanskaffning och mer som ett strategiskt steg för att säkra de ingenjörer och forskare som har rekryterats av konkurrenter i det intensifierade globala AI‑talangkriget. Företaget grundades 2022 av tidigare Baidu‑ och iFlytek‑veteraner och har redan säkrat omkring 200 miljoner dollar i seed‑finansiering och Serie A‑finansiering, vilket gjort det möjligt att lansera flaggskeppsmodellen DeepSeek‑Chat samt en svit av företags‑API:er. Men den snabba modellskalningen, i kombination med stigande lönekrav, har gjort DeepSeek sårbart för talangflykt. Genom att bjuda in nya aktieägare – potentiellt riskkapitalbolag, statliga förmögenhetsfonder eller strategiska företagspartners – hoppas DeepSeek skapa en kapitalpool som kan användas för att tilldela aktieoptioner och behållningsbonusar, vilket sam
424

Nationella säkerhetsbyrån använder Anthropics Mythos trots svartlistning

Nationella säkerhetsbyrån använder Anthropics Mythos trots svartlistning
HN +7 källor hn
anthropic
Nationella säkerhetsbyrån har börjat distribuera Anthropics "Mythos Preview"-modell, trots att försvarsdepartementet formellt klassificerade teknologin som en leverantörskedjerisk och placerade den på en svartlista förra månaden. Enligt flera rapporter använder NSA artificiell intelligens främst för att skanna sina egna nätverk efter utnyttjbara sårbarheter, ett användningsfall som speglar hur andra godkända enheter använder modellen för interna säkerhetsrevisioner. Anthropic lanserade Mythos som en specialiserad cybersäkerhetsassistent, som utnyttjar dess förmåga att tolka kod, identifiera felkonfigurationer och föreslå åtgärder för avhjälpning i en hastighet som vida överstiger mänskliga analytiker. Pentagonns beteckning härrör dock från farhågor om att modellens träningsdata och underliggande arkitektur kan komprometteras av fientliga aktörer, en risk som förstärks av byråns beroende av molntjänster från tredje part. Genom att kringgå svartlistan signalerar NSA en vilja att prioritera operativ fördel framför de säkerhetsåtgärder för leverantörskedjan som försvarsdepartementet försöker upprätthålla. Beslutet är viktigt av flera skäl. Först understryker det en växande spänning mellan snabb AI-antagande i underrättelsearbete och den nybildade regleringsramen som är tänkt att begränsa potentiella bakdörrar. För det andra väcker det frågor om samordning mellan myndigheter: om NSA kan ignorera en försvarsdepartementsdirektiv, kan andra departement följa efter, vilket skulle urholka auktoriteten för svartlistan. Slutligen lägger beslutet vikt till tidigare varningar från finansministrar och toppbankirer, som har flaggat Mythos som en systemrisk, och från säkerhetsexperter som Bruce Schneier, som varnade för att oövervakade AI-verktyg kan bli en ny attackyta. Vänta på ett formellt svar från försvarsdepartementets kontor, som kan skärpa tillämpningen eller utfärda nya riktlinjer för AI-inköp. Kongresskommittéer kommer sannolikt att kalla både NSA och Anthropic till vittnesmål, och eventuella rättsliga utmaningar mot svartlistan kan sätta ett prejudikat för hur AI-modeller styrs i den federala landskapsbilden. Episoden lägger också press på Anthropic att lösa sina pågående rättsliga strider och förtydliga ursprunget för Mythos träningsdata, en faktor som kan avgöra om modellen förblir en omstridd tillgång eller till slut dras tillbaka från regeringsanvändning.
365

Suno och Deepseek lanserar AI‑drivet spår “Start of Civilization”

Mastodon +7 källor mastodon
deepseek
Sunos AI‑drivna musikmotor har precis presenterat “Start of Civilization”, ett helt syntetiskt spår där sånglinjen återges med en UTAU‑liknande röstbank medan texterna genereras av Deepseeks stora språkmodell. Låten, som publicerades på YouTube (https://www.youtube.com/watch?v=_hjsBXt6_N4), är det senaste samarbetet mellan de två nordiska AI‑företagen och markerar ett steg framåt från experimentet “Compass North” som vi rapporterade den 14 april, då Suno och Deepseek först kombinerade musiksyntes med AI‑skrivna verser. Utgivningen visar hur långt generativt ljud har utvecklats från ett nyhetsfaktor‑projekt till ett arbetsflöde som kan producera polerade, genrespecifika verk på begäran. Suns modell, som nu finns i en rysktalande portal, kan komponera melodier, arrangera instrumentering och rendera vokalspår utan mänskliga artister. Deepseeks textmotor levererar kontextkänsliga texter som anpassar ton och berättelse efter användarens instruktioner. Tillsammans levererar de ett spår som känns avsiktligt utformat snarare än en slumpmässig mash‑up, komplett med vocaloid‑liknande timbri som tilltalar nischade fan‑gemenskaper samtidigt som det är tillgängligt för mainstreamlyssnare. Branschobservatörer ser partnerskapet som ett litmusprov för den kommersiella hållbarheten i AI‑endast musikproduktion. Om skapare kan generera royaltyfria låtar på några minuter kan ekonomin kring licensiering av soundtracks, indie‑spelscore och TikTok‑liknande innehåll förändras dramatiskt. Samtidigt återuppstår frågor om upphovsrätt, attribution
346

Anthropic har introducerat Claude Design, ett nytt AI‑verktyg som låter användare skapa visuella element som prototyper

Anthropic har introducerat Claude Design, ett nytt AI‑verktyg som låter användare skapa visuella element som prototyper
Mastodon +7 källor mastodon
agentsanthropicclaude
Anthropic presenterade Claude Design på tisdagen, ett nytt erbjudande från Claude Labs som omvandlar enkla språkkommandon till polerade visuella tillgångar såsom produktprototyper, presentationsbilder och marknadsföringsmaterial. Användare skriver in en beskrivning – ”en elegant mock‑up av en landningssida för en fintech‑app” eller ”en tre‑kolumners slide som sammanfattar Q2‑resultaten” – och systemet levererar grafik som är klar för export, layoutförslag och redigerbara vektor‑filer. Funktionen bygger på Claudes senaste verktygsuppgraderingar, som vi rapporterade den 20 april när startupen meddelade modellens förmåga att använda programvara på en dator på samma sätt som en människa. Lanseringen markerar ett avgörande skifte för Anthropic från en text‑centrerad chatbot till ett fullständigt kreativt arbetsflöde. Genom att kombinera naturlig språk‑generering med bildsyntes och design‑automation syftar Claude Design till att sänka tröskeln för icke‑designers att skapa visuella material av professionell kvalitet, ett område som för närvarande domineras av specialiserade generatorer som Midjourney, Adobe Firefly och OpenAIs DALL·E. För företag lovar verktyget snabbare itereringscykler och minskat beroende av externa designbyråer, vilket potentiellt kan omforma budgetering och bemanning i marknads‑ och produktteam. Vad som händer härnäst kommer att avgöra om Claude Design blir en mainstream‑arbetskraft eller ett nischat tillägg. Viktiga indikatorer att bevaka är prismodellen och omfattningen av exportformat – särskilt om verktyget stödjer branschstandardverktyg som Figma, Sketch eller Canva. Integration med Anthropics bredare agent
303

Anthropic installerar spionprogramvara i smyg när du installerar Claude Desktop

Anthropic installerar spionprogramvara i smyg när du installerar Claude Desktop
Mastodon +8 källor mastodon
anthropicclaudeprivacy
Anthropics klientprogram Claude Desktop har visat sig innehålla en dold drop-per som installerar spionprogramvara på Windows-datorer. Säkerhetsforskare som undersökte installatörerna upptäckte att efter att det legitima Claude-programmet placerats i C:\Program Files (x86)\Anthropic\Claude, pekar skrivbordsgenvägen till ett VBScript (Claude.vbs) som lagras i en tillfällig SquirrelTemp-mapp. När du klickar på genvägen startas den riktiga AI-gränssnittet medan skriptet tyst körs en andra etapp som öppnar en bakdörr till värddatorn, vilket ger fjärråtkomst till filer och systeminformation. Den skadliga komponenten är dold i ett MSI-paket som imiterar Anthropics officiella installationskedja, vilket gör det omöjligt för de flesta användare att skilja det från den äkta nedladdningen. Drop-paren aktiveras bara när genvägen används, vilket innebär att spionprogramvaran kan förbli latent i dagar eller veckor innan någon nätverkstrafik observeras. Forskare säger att koden bär kännetecken från kända kommersiella övervakningsverktyg, vilket tyder på en medveten ansträngning snarare än en oavsiktlig förpackning. Avslöjandet är viktigt eftersom Claude Desktop marknadsförs som en produktivitetsboostande "lokalt först" AI-assistent som lovar smidig integration med e-post, kalendrar och filsystem. Genom att infoga en dold bakdörr undergräver Anthropic de garantier för integritet som de förordar, vilket utsätter företags- och personuppgifter för potentiell exploatering. Incidenten lägger också till en rad av nyliga säkerhetsproblem kring Anthropic, inklusive NSA:s hemliga användning av dess Mythos-modell trots en svartlista och omvänd ingenjörskonst av Claudes kodbas som avslöjade omfattande operativa sele. Vad man ska se fram emot: Anthropic har inte utfärdat någon formell kommentar, men branschanalytiker förväntar sig en nödpatch och en grundlig granskning av distributionspipelinen för skrivbordsprogram. Tillsynsmyndigheter i EU och Norge kan inleda utredningar enligt GDPR och den kommande AI-lagen. Användare rekommenderas att avinstallera Claude Desktop omedelbart, verifiera integriteten hos eventuella återstående filer och övervaka nätverkstrafik för misstänkta utgående anslutningar. Episoden kommer troligen att påskynda kraven på strängare säkerhetsstandarder för AI-programvaror.
226

Hur man styr användningen av Claude Code i utvecklingsteam

Hur man styr användningen av Claude Code i utvecklingsteam
Dev.to +7 källor dev.to
anthropicclaude
Anthropic har lanserat ett dedikerat styrskikt för Claude Code, företagets AI-assisterade programmeringsverktyg som har spridit sig snabbt över utvecklingsgrupper. Den nya "Claude Code Enterprise"-konsolen låter administratörer ange rollbaserade behörigheter, tillämpa innehållsfilter och övervaka användningen genom realtidsinstrumentpaneler och revisionsloggar. Anthropic införde funktionen efter att en kund avslöjade en nära miss: en juniorutvecklare använde Claude Code för att generera en bibliotek som oavsiktligt inkorporerade en inaktuell intern API, vilket exponerade en potentiell säkerhetsbrist innan den nådde produktion. Incidenten belyste hur modellens djupa systemspecifika kunskaper, som en produktivitetsförbättring, också kan kringgå traditionella kodgranskningsåtgärder om den lämnas oövervakad. Beslutet är viktigt eftersom Claude Code inte längre är ett nischverktyg för ett fåtal seniora utvecklare; Anthropics egen forskning visar att 132 av deras anställda nu använder modellen dagligen, och externa undersökningar indikerar liknande antagningskurvor i stora företag. Eftersom assistenten kan syntetisera arkitekturdiagram, skriva prestandakritiska slingor och till och med föreslå tredjepartsberoenden, ökar oövervakad användning farhågor kring kodkvalitet, läckage av immateriella rättigheter och regelefterlevnad - särskilt i sektorer med stränga regler för datahantering. Genom att ge insyn i "vem genererade vad, när och under vilken policy" syftar Anthropic till att anpassa AI-driven utveckling till befintliga styrmodeller. Vad man ska se nästa är hur snabbt konsolen får fäste bland nordiska techföretag som redan har experimenterat med Claude Code i pilotprojekt, som rapporterats i vår tidigare täckning av lokala instrumentpaneler och integritetskontroller. Integration med CI/CD-pipelines, automatiserad policytillämpning under pull-förfrågningskontroller och införandet av användningsbaserad faktureringstak är planerat till nästa kvartal. Konkurrenter som GitHub Copilot och Google Gemini förväntas svara med jämförbara adminsviter, vilket gör AI-kodstyrning till en ny stridszon för företagsutvecklare.
226

AI Leaks and News på X

Mastodon +8 källor mastodon
appledeepseekgoogle
DeepSeek, ett kinesiskt startup inom artificiell intelligens, meddelade en finansieringsrunda på 300 miljoner dollar som höjer företagets värdering till 10 miljarder dollar. Kapitalet, som kommer från en blandning av inhemska riskkapitalbolag och statliga förmögenhetsinvesterare, är avsett för att utöka den beräkningsinfrastruktur som behövs för att lansera DeepSeek‑v4, företagets nästa generations stora språkmodell. Denna kapitalanskaffning är den största enskilda infusionen i en kinesisk LLM‑utvecklare i år och signalerar att landets AI‑sektor fortfarande lockar djupa fickor trots skärpta exportkontroller på högpresterande chip. DeepSeeks tidigare modeller, såsom den öppna källkods‑modellen DeepSeek‑Coder, har hyllats för sin kodningsförmåga och har fått fäste i utvecklargemenskaper i Östasien. Genom att skala upp till v4 hoppas företaget minska prestationsgapet mot västerländska konkurrenter som OpenAI, Anthropic och Google, vars egna finansieringscykler nyligen har accelererat – Anthropic säkrade till exempel en regeringsomfattande utrullning av sin Mythos‑modell bara dagar före ett läckage av källkoden. Investerarna ser rundan som ett vad på Kinas förmåga att bygga inhemska beräkningskluster, en strategisk prioritet efter att USA begränsade försäljning av halvledare till kinesiska AI‑företag. Infusionen understryker också en bredare förändring: AI‑startup‑företag utanför den traditionella Silicon‑Valley‑banan söker nu värderingar på flera miljarder dollar, vilket omformar den globala talang‑ och kapitalkartan. Det som blir intressant att följa är om DeepSeek kan leverera v4 i tid och hur dess prestanda står sig mot de senaste släppen från OpenAIs GPT‑5.4 och Googles Gemini. Lika viktigt blir de regulatoriska svaren i både Peking och Washington, särskilt eventuella nya exportrestriktioner som kan påverka DeepSeeks tillgång till toppmoderna GPU‑er. De kommande finansieringsmeddelandena från andra asiatiska AI‑spelare kommer ytterligare klargöra om denna uppgång representerar en varaktig ombalansering av AI‑makten eller en kortsiktig finansieringsfrenesi.
171

Förändringar i systemprompten mellan Claude Opus 4.6 och 4.7

Mastodon +8 källor mastodon
anthropicclaude
Anthropic lanserade Claude Opus 4.7 den 16 april 2026, och för första gången sedan juli 2024 publicerade företaget den fullständiga systemprompten som styr modellens beteende. Den nyligen släppta prompten skiljer sig markant från den som användes i Opus 4.6, genom att den skärper instruktionsföljelsen, byter ut en reviderad tokenisator och omformar hur modellen hanterar verktygsanvändning, långvariga arbetsflöden och "agenterelaterade" kodningsuppgifter. Förändringarna är viktiga eftersom systemprompten är den dolda regelboken som bestämmer hur Claude tolkar användarbegäranden, prioriterar säkerhet och allokerar beräkningsresurser. Genom att göra prompten offentlig erbjuder Anthropic utvecklare en sällsynt inblick i de reglage som styr modellens prestanda, en transparensrörelse som inte matchas av andra stora laboratorier. Den strängare instruktionsuppsättningen minskar "hallucinationer" vid komplexa programvaruutvecklingsfrågor, ett påstående som stöds av Anthropics egna benchmark-tester som visar att Opus 4.7 presterar bättre än 4.6 på de tuffaste kodningsutmaningarna. Den nya tokenisatorn ändrar också tokenbokföring, vilket innebär att befintliga API-anrop kan se olika kostnadsberäkningar och tokenbegränsningar. Utöver prompten lägger Opus 4.7 till hantering av högupplösta bilder upp till 3,75 megapixlar och introducerar en "xhigh"-ansträngningsnivå som allokerar extra beräkningsresurser för krävande uppgifter. Dessa uppgraderingar breddar Claudes tilltalande för visuellt tunga arbetsflöden och för företag som behöver djupare resonemang utan att offra hastighet. Vad man ska se fram emot är hur samhället reagerar på den offentliggjorda prompten. Tidiga antagare kommer sannolikt att experimentera med prompttekniska hak, medan konkurrenter kan känna tryck för att följa Anthropics transparensplaybook. Analytiker kommer också att övervaka om den nya tokenisatorn omformar prismodeller och om den strängare instruktionsregimen påverkar modellens flexibilitet i kreativa områden. Den nästa modelluppdateringen, som planeras till senare i år, kommer att visa om Anthropic kan upprätthålla prestandavinster samtidigt som prompten hålls öppen för granskning.
162

OpenAI uppdaterar “Codex Desktop” – Ökar produktiviteten för icke‑utvecklare – ZDNET Japan

Mastodon +9 källor mastodon
agentsopenai
OpenAI har lanserat en omfattande uppgradering av sin Codex Desktop‑plattform, där verktyget har förflyttats från en utvecklar‑centrerad kodassistent till en bredare produktivitetsserie riktad mot icke‑tekniska yrkespersoner. Uppdateringen, som först beskrevs av ZDNET Japan, lägger till funktioner för datorstyrning, en inbyggd webbläsare, bildgenerering, ett beständigt automatiseringsminne samt en marknadsplats med mer än 90 tillägg. Nya arbetsflödesfunktioner låter användare svara på GitHub‑granskningskommentarer, köra flera terminalflikar och ansluta till fjärr‑dev‑boxar via SSH, medan Codex‑appen för macOS nu stödjer parallell agentkörning och samarbete kring långvariga uppgifter. Flytten är betydelsefull eftersom den signalerar OpenAIs ambition att förvandla sin “super‑app”-vision till en universell arbetsassistent, i direkt konkurrens med Microsofts Copilot och Googles Gemini‑produktivitetsskikt. Genom att sänka den tekniska tröskeln för AI‑stödd automatisering hoppas OpenAI kunna erövra en större del av företagsmarknaden, där anställda spenderar timmar på repetitiva uppgifter som datainmatning, rapportgenerering och grundläggande skriptning. Expansionen sammanfaller också med företagets nyliga lansering av GPT Rosaline‑modellen för livsvetenskaplig forskning och den pågående “reasoning‑battle” med Nvidia, vilket understryker en strategi som kombinerar avancerade resonemangsmodeller med praktiska verktyg. Som vi rapporterade den 19 april introducerade OpenAI Codex All‑in‑One‑appen för utvecklare; dagens uppdatering markerar det första tydliga steget mot icke‑utvecklare. Vad som bör bevakas härnäst inkluderar utrullningsschemat för Windows och macOS, prisnivåer för enskilda respektive företagsanvändare, samt hur OpenAI kommer att integrera sitt framväxande agent‑AI‑ramverk i Codex‑s multi‑agent‑orkestrering. Säkerhet och integritet kommer också att stå i fokus, med tanke på appens förmåga att kontrollera lokala maskiner och få åtkomst till externa data. De kommande veckorna bör avslöja om produktivitetslöftet omvandlas till mätbar adoption på företagsarbetsplatser.
150

Sluta ge AI‑agenter AWS‑uppgifter: ett bättre sätt att säkra åtkomst

Sluta ge AI‑agenter AWS‑uppgifter: ett bättre sätt att säkra åtkomst
Dev.to +6 källor dev.to
agents
En ny säkerhetsmanual uppmanar utvecklare att sluta ge AI‑agenter råa AWS‑uppgifter och istället låta agenterna generera infrastruktur‑som‑kod som tillämpas av en privilegierad pipeline. Metoden, som molnarkitekt Sarvar beskriver i ett nyligt blogginlägg, har redan testats på flera fintech‑företag som använde stora språkmodell‑agenter för att i realtid provisionera RDS‑instanser, IAM‑policyer samt SNS‑/SQS‑köer. Istället för att bädda in åtkomstnycklar i agentens körning, producerar agenterna nu Terraform‑moduler som beskriver de önskade resurserna; ett separat CI/CD‑jobb validerar koden, kör en policykontroll och tillämpar den med ett tjänstekonto som har begränsade behörigheter. Skiftet är viktigt eftersom läckage av autentiseringsuppgifter har blivit en högprioriterad risk i den ökande användningen av agentbaserad AI. Nyliga incidenter – som Anthropics plötsliga återkallelse av Claude‑åtkomst för en kund med 60 konton – visar hur snabbt förtroendet kan försvinna när en agent kan agera utan kontroll i en molnmiljö. Genom att koppla loss avsikt (agentens plan) från utförande (det privilegierade tillämpningssteget) kan organisationer upprätthålla regelefterlevnad, granska förändringar och förhindra lateral rörelse som annars skulle vara möjlig med en stulen nyckel. Metoden kompletterar även AWS egna Security Agent‑ och DevOps Agent‑tjänster, som syftar till att integrera AI i företagets säkerhetsstack utan att utöka attackytan. Det som blir intressant att följa är om praktiken får fäste som en de‑facto‑standard för AI‑driven molnautomatisering. Tidiga användare integrerar arbetsflödet med A2A Agent Registry, ett centralt katalogsystem som lagrar “AgentCards” med beskrivningar av funktioner och slutpunkter, och som kan bli ryggraden för tvärfunktionell styrning. Branschanalytiker kommer att bevaka AWS framtidsplan för tätare autentiseringsfria integrationer med Bedrock och andra LLM‑leverantörer, samt eventuella nya verktyg med öppen källkod som automatiserar Terraform‑genereringsslingan. Om modellen visar sig skalbar kan den omforma hur företag balanserar agiliteten hos autonoma agenter med rigor i molnsäkerhet.
150

Lär dig att utvärdera kvaliteten på din AI‑agent, RAG och LLM

Lär dig att utvärdera kvaliteten på din AI‑agent, RAG och LLM
Dev.to +5 källor dev.to
agentsrag
En handledning och tillhörande blogginlägg som släpptes den 19 april 2025 av den brasilianska AI‑praktikern Airton Lira Jr. erbjuder den första end‑to‑end‑spelboken för att mäta prestandan hos autonoma AI‑agenter, retrieval‑augmented generation (RAG)‑pipelines och de underliggande stora språkmodellerna (LLM). Guiden, med titeln “Aprenda avaliar a qualidade do seu agente de AI, RAG e LLM”, samlar ett steg‑för‑steg‑notebook som bygger en RAG‑applikation med Mosaic AI Agent Framework, kör den nya “Agent Evaluation”-sviten och omvandlar råa poäng till handlingsbara insikter. Tidpunkten är betydelsefull. Under det senaste året har nordiska utvecklare tävlat om att leverera lokalt körda agenter — Lore 0.2.0, den SQLite‑stödda “localmind”‑CLI:n och andra eval‑drivna verktyg — men en gemensam måttstock för kvalitet har förblivit svårfångad. Liras arbete samlar de metrik som förespråkas av IBM och nyliga akademiska undersökningar: uppgiftsframgångsgrad, hallucinationsfrekvens, latens, token‑effektivitet och kostnad per inferens. Genom att automatisera dessa kontroller i ett reproducerbart notebook sänker guiden tröskeln för kontinuerlig utvärdering, en praxis vi lyfte fram i vår rapport den 19 april 2026 om att leverera Lore 0.2.0 med förtroende. Praktiker kan nu integrera utvärderingspipeline i CI/CD, fånga regressioner innan driftsättning och producera revisionsklara rapporter som överensstämmer med de framväxande EU‑AI‑Act‑kraven. Det bredare AI‑samhället citerar redan handledningen som en referenspunkt för benchmark‑skapande, och Mosaic har meddelat en kommande integration med Implicator LLM Meter, som nyligen såg Gemini överträffa ChatGPT på den skalan. Vad som är värt att hålla ögonen på härnäst: antagandet av Liras ramverk av öppen‑källkodsprojekt som localmind, lanseringen av standardiserade agent‑benchmarks av europeiska konsortier och eventuella uppdateringar från IBM kring företagsklassade utvärderingsverktyg. Om guiden får genomslag kan den bli den de‑facto‑baslinjen för pålitlig agentutveckling i hela det nordiska AI‑ekosystemet.
132

Bannad av Anthropic?

Bannad av Anthropic?
HN +5 källor hn
agentsanthropicclaudeopen-source
Anthropic har abrupt avbrutit åtkomsten till sina Claude‑modeller för användare av OpenClaw, det öppna AI‑agent‑ramverket som har blivit en stapelvara för utvecklare som bygger autonoma verktyg. På tisdagen inaktiverade företaget den OAuth‑token som många projekt förlitade sig på för att autentisera Claude‑prenumerationer, vilket gjorde tjänsten oanvändbar “utan förvarning, utan övergångsperiod.” Åtgärden utlöst en storm på Hacker News, där tråden samlade över 700 poäng och nästan 600 kommentarer inom tolv timmar, med utvecklare som anklagar Anthropic för “brist på respekt” och pekar på en liknande nedstängning av Windsurf‑projektet i juni. Förbudet är betydelsefullt eftersom OpenClaws popularitet har gjort det till en de‑facto‑standard för att bygga flerstegiga AI‑agenter i moln‑, kant‑ och skrivbordsmiljöer. Genom att dra i strömmen stör Anthropic inte bara tusentals aktiva pipelines utan signalerar också en förskjutning mot striktare kontroll av sina kommersiella API:er. Beslutet följer en bredare åtstramning av Anthropics teknik: den amerikanska regeringen förbjöd företaget från federalt bruk i februari, och Vita husets svartlista har tvingat myndigheter att förhandla om begränsad, klassificerad åtkomst till Anthropics Mythos‑modell. T
131

NSA använder Anthropics Mythos trots svartlista

HN +6 källor hn
anthropic
Den nationella säkerhetsbyrån (NSA) har börjat köra Anthropics oannonserade “Mythos Preview”-modell för cybersäkerhet och underrättelsearbete, trots att Pentagon formellt har klassat det san‑franciscobaserade startup‑företaget som en “leveranskedjerisk” och ett verkställigt beslut från februari förbjuder federala myndigheter att använda Anthropics verktyg. Två seniora källor berättade för Axios att NSA:s cyberförsvarsteam utnyttjar Mythos för att analysera hotintelligensflöden, automatisera sårbarhetsbedömningar och utarbeta incidentrespons‑briefingar, trots den svartlista som avsåg att hålla teknologin borta från statliga händer. Beslutet är betydelsefullt eftersom det ställer två mäktiga delar av den amerikanska säkerhetsapparaten mot varandra. Försvarsdepartementets riskklassificering var avsedd att skydda klassificerade nätverk från potentiella bakdörrar eller dataläckagevägar som kan vara inbäddade i tredjeparts‑AI‑modeller. Genom att kringgå den restriktionen signalerar NSA i praktiken att de operativa fördelarna med Mythos väger tyngre än de upplevda leveranskedjeriskerna. Beslutet väcker också frågor om efterlevnad av verkställiga ordern från den 27 februari, vilket kan leda till interna revisioner eller kongressgranskning. Som vi rapporterade den 19 april hade finansministrar och ledande bankirer redan uttryckt allvarliga farhågor kring modellens tillförlitlighet och den desinformation som omgav lanseringen. NSA:s antagande lägger till ett nytt lager av brådska i dessa debatter och belyser hur snabbt hög‑risk‑AI kan tränga in i kritisk infrastruktur trots formella förbud. Håll utkik efter en formell utredning från Office of the Director of National Intelligence, möjliga revideringar av Pentagons ramverk för riskklassificering och Anthropics juridiska svar på myndighetens användning av en oannonserad produkt. Lika viktigt blir det om andra underrättelse‑ eller brottsbekämpande organ följer NSA:s exempel, vilket potentiellt kan omforma balansen mellan AI‑innovation och nationella säkerhetsåtgärder.
130

Claude Tokenräknare, nu med modelljämförelser

Claude Tokenräknare, nu med modelljämförelser
HN +7 källor hn
anthropicclaudegeminigrok
Anthropic har uppgraderat sin kostnadsfria Claude Tokenräknare genom att lägga till sida‑vid‑sida‑jämförelser för de tre flaggskeppsmodellerna Claude – Opus, Sonnet och Haiku – samt en snabb översikt över rivaliserande LLM‑modeller som GPT‑5 och Gemini. Det webbaserade verktyget visar nu hur många token en given prompt förbrukar på varje modell, de motsvarande gränserna för kontextfönstret och den uppskattade API‑kostnaden enligt nuvarande prissättningsnivåer. Förbättringen är viktig eftersom token‑antalet är den främsta drivkraften för både latens och kostnad i generativa‑AI‑arbetsflöden. Utvecklare som finjusterar prompts för Claude måste ofta gissa om en förfrågan ryms inom modellens 100 000‑token‑fönster eller hur mycket ett svar på 2 000 token kommer att kosta. Genom att visa samma texts tokenisering på Opus (den mest kapabela, 200 k token‑fönster), Sonnet (mellansegment, 100 k) och Haiku (lättviktig, 50 k) låter räknaren ingenjörer välja den billigaste modellen som ändå uppfyller prestandakravet. Den nya tvärmodellsvyn avslöjar också tokenizer‑nyanser som gör att en 1 000‑token‑prompt i GPT‑5 motsvarar ungefär 1 200 token i Claude, ett avsteg som kan överraska budgetmedvetna team. Som vi rapporterade den 20 april, ökar Claudes mångsidighet – från att skriva Z80‑assemblerkod till att navigera minneshål‑buggar – och driver en bredare adoption i nischade områden. Korrekt token‑redovisning tar nu bort ett praktiskt hinder för den adoptionen, särskilt för startups och forskargrupper som övervakar API‑utgifter rad för rad. Framåt ser Anthropic ut att lansera realtids‑kostnadsprognoser och batch‑behandlingsanalys i samma gränssnitt. Observatörer kommer att följa om token‑räknar‑API:t öppnas för integration i IDE‑plugins och CI‑pipelines, ett steg som kan standardisera kostnadskontrollpraxis i den nordiska AI‑utvecklarsamhället. Den nästa uppdateringen kan även utvidga jämförelserna till att omfatta framväxande modeller som Grok och kommande Claude‑4‑utgåvor, vilket skärper verktygets roll som en universell LLM‑budgetdashboard.
118

P0: Hackathonresultat [2024-05-27 lör] Jag förlorade i Hackathon ⛈, våra lösningar har låg rang

P0: Hackathonresultat [2024-05-27 lör] Jag förlorade i Hackathon ⛈, våra lösningar har låg rang
Mastodon +19 källor mastodon
En ensam utvecklare offentliggjorde en efterhandsanalys av den AI‑inriktade hackathon som hölls den 27 maj 2024 och medgav att hans lag avslutade utan pris efter att lösningen fick en “low ranging”‑poäng. Inlägget byggde på en LangChain‑orchestrerad pipeline som matade en stor språkmodell (LLM) med ett “kontext‑fråga‑svar”-dataset, bad modellen flagga felaktiga tripplar och lagrade dialogen i ett temporärt chattminne för att bevara kontexten mellan anrop. Tillvägagångssättet visade sig konceptuellt solid men misslyckades under tävlingens utvärderingskriterier, som straffade falska positiva och belönade precision på ett dolt testset. Varför detta bakslag är betydelsefullt är tvådelat. För det första illustrerar det klyftan mellan prototypsnivå‑LLM‑verktyg och produktionsklar pålitlighet. Även om LangChain och liknande ramverk sänker tröskeln för att bygga konversationsagenter, lämnar de fortfarande utvecklare att manuellt hantera prompt‑design, token‑gränser och felpropagation. För det andra understryker händelsen den växande efterfrågan på robusta orkestreringsgränssnitt som kan visa modellens förtroende, spåra annoteringsursprung och förenkla iterativ felsökning — funktioner som nyligen lanserade öppen‑käll‑projekt som OpenClawdex, UI‑lagret för Claude Code och Codex, syftar till att leverera. Som vi rapporterade den 19 april 2026 betonade “det mentala ramverket för att låsa upp agent‑drivna arbetsflöden” behovet av systematiska felsökningsloopar; detta hackathon‑förlust är en konkret påminnelse om att dessa loopar fortfarande är omogna i snabba tävlingar. Att hålla ögonen på framöver inkluderar lanseringen av version 2.0 av LangChain, som lovar inbyggda utvärderings‑hooks, samt den kommande Nordiska AI‑Hackathonen i juni, där arrangörerna har lovat tätare integration med öppna orkestratorer. Observatörer kommer också att vara intresserade av eventuella uppföljningar från deltagaren, som antydde att han planerar att åter
117

Installerade Anthropic en spionprogram‑brygga på min dator?

Installerade Anthropic en spionprogram‑brygga på min dator?
HN +5 källor hn
anthropicclaudeprivacy
Anthropic’s Claude Desktop har i hemlighet installerat en native‑messaging‑brygga på användarnas datorer, ett drag som säkerhetsforskare menar motsvarar en vilande spionprogramkomponent. Bryggan läggs till under den vanliga Claude Desktop‑installationen och registreras i sju Chromium‑baserade webbläsare – inklusive Chrome, Edge, Brave och till och med webbläsare som användaren inte har installerat. Anthropics egen dokumentation påstår att den inte stödjer flera av dessa webbläsare, men bryggan finns ändå. Bryggan förblir inaktiv tills en matchande tillägg, en företags‑policy‑push, en skadlig uppdatering eller ett angriparpåkallat payload aktiverar den. Vid den tidpunkten kan den öppna en direkt kommunikationskanal mellan webbläsaren och Claudes lokala runtime, vilket möjliggör godtycklig kodexekvering med användarens behörigheter. Forskare som granskade installatören beskriver komponenten som ”förinstallerad spionprogramkapacitet, tyst placerad, vilande, väntande på aktivering”. Varför detta är viktigt sträcker sig bortom en enskild produkt. Native‑messaging‑bryggor har tidigare utnyttjats i leveranskedjeattacker för att leverera fjärråtkomst‑trojaner, och den senaste Axios‑npm‑kompromissen visade hur snabbt sådana vektorer kan spridas. Claude Desktop marknadsförs både till enskilda utvecklare och till företagsgrupper, vilket innebär att bryggan kan spridas över företagsnätverk utan uttryckligt samtycke och potentiellt bryta mot GDPR samt Norges dataskyddsregler. Anthropic har ännu inte lämnat ett formellt uttalande, men företagets senaste säkerhetsavslöjanden – såsom Linux‑kernel‑exploater som upptäckts av deras egen modell – tyder på att de är medvetna om den bredare attackytan. Kommande steg att hålla ögonen på är en eventuell nödpatch eller borttagning av bryggan, en detaljerad granskning av Claude Desktops installatör samt regulatorisk granskning från EU‑ och nordiska dataskyddsmyndigheter. Branschobservatörer kommer också att följa om andra AI‑verktygsleverantörer inför liknande native‑messaging‑komponenter, och hur samhällets respons formar framtida standarder för AI‑programvarans leveranskedja.
117

Ubers satsning på Anthropic AI stöter på hinder

Ubers satsning på Anthropic AI stöter på hinder
HN +5 källor hn
anthropicclaude
Ubers interna satsning på att integrera Anthropics AI‑verktyg har tappat fart. Chief Technology Officer Praveen Neppalli Naga berättade för The Information att ride‑hailing‑jätten redan har förbrukat sin AI‑budget för 2026 – en FoU‑allokering på 3,4 miljarder dollar – redan under första kvartalet. Underskottet beror på en kraftig ökning i användningen av Anthropic’s Claude Code, en generativ kodassistent som teamen har tagit i bruk för allt från skript för ruttoptimering till pipeline för bedrägeridetektion. Denna överskridning tvingar Uber tillbaka till ritbordet, där företaget nu omprövar hur man skalar AI‑drivna funktioner utan att överskrida kostnaderna. Som vi rapporterade den 19 april har Claude Code nyligen avslöjats i ett läckage som belyste kritiska kommandoinjektions‑sårbarheter. Dessa säkerhetsproblem, kombinerat med verktygets höga prissättning per token, verkar ha förvärrat Ubers finansiella påfrestning. Varför detta är viktigt sträcker sig bortom en enskild företagsbudget. Ubers erfarenhet belyser en växande spänning i branschen: löftet om snabb AI‑driven innovation kontra verkligheten med höga, ofta oförutsägbara, driftskostnader. För företag som har satsat tungt på tredjeparts‑stora språkmodeller fungerar händelsen som en varningssignal om dolda konsumtionsspikar och behovet av striktare kostnadskontroll. Det lägger också press på Anthropic, vars prissättningsmodell nu kan komma under granskning av andra företagskunder som är rädda för okontrollerade utgifter. Det som blir intressant att följa är om Uber omförhandlar sitt avtal med Anthropic, skiftar till en intern modell, eller begränsar AI‑utplaceringen i hela sin produktportfölj. Anthropics svar – eventuellt justering av prissättningsnivåer eller erbjudande om mer detaljerad användningsanalys – blir en viktig indikator på hur marknaden anpassar sig till företagskostnadsfrågor. Slutligen kommer andra AI‑tunga aktörer som Lyft, DoorDash och Amazon sannolikt att följa Ubers omkalibrering noggrant, när de själva navigerar genom samma budgetmässiga minfält.
109

Den här personen finns inte

Mastodon +7 källor mastodon
nvidia
Ett team av utvecklare på en nyligen hålld nordisk hackathon presenterade ett lättviktigt skript som förvandlar den populära AI‑genererade ansikts‑tjänsten thispersondoesnotexist.com till ett praktiskt anonymiseringsverktyg. Genom att automatisera ett trestegsschema – nedladdning av ett slumpmässigt 1024 × 1024‑porträtt, beskärning med ImageMagick och borttagning av all EXIF‑metadata via exiftool – demonstrerade deltagarna hur vem som helst kan skapa en fotorealistisk ”person” utan någon spårning av ursprung. Proof‑of‑concept‑en väckte omedelbart intresse eftersom den kringgår de vanliga integritetsbarriärerna vid uppladdning av en riktig selfie: den genererade bilden innehåller ingen biometrisk data, inga plats‑taggar eller kamerainformation. Teamet stötte dock på ett hinder när de testade uppladdningar till sociala plattformar. Moderna webbplatser förlitar sig i allt högre grad på canvas‑baserad fingeravtrycks‑teknik, en webbläsarmetod som renderar en dold grafik och extraherar
90

En cachevänlig IPv6 LPM med AVX-512 (lineariserad B+-träd, verkliga BGP-benchmarks)

En cachevänlig IPv6 LPM med AVX-512 (lineariserad B+-träd, verkliga BGP-benchmarks)
HN +5 källor hn
benchmarksvector-db
En ny öppen källkods-bibliotek, planb-lpm, levererar en cachevänlig IPv6 längsta-prefix-matchning (LPM) motor som utnyttjar Intels AVX-512 SIMD-utvidgningar. Kärnan i designen är ett 9-gradigt lineariserat B-plus-träd packat i 64-byte cache-linjejusterade noder, där varje löv innehåller åtta nycklar. Sökning sker som en ren föregångssökning: på varje intern nivå följs en enda AVX-512 vpcmpuq-instruktion av en popcnt som bestämmer undernoden, och samma operation på lövet identifierar den matchande prefixet. Författarens GitHub-läsbart visar att algoritmen expanderar varje IPv6-prefix till ett start-slutintervall på de övre 64 bitarna, sorterar de 2 × N-gränserna och löser instickning med en stack så att varje elementär intervall känner till sin aktiva nästa-hopp. Benchmark-tester som körs på verkliga BGP-tabeller - över 800 k IPv6-prefix - rapporterar sökningshastigheter som överstiger 30 Mpps på en enda Xeon Scalable-processor medan latensen hålls under 30 ns. Jämfört med tidigare CPU-baserade lösningar och även GPU-accelererade motorer, minskar AVX-512-implementeringen minnes-trafiken med upp till 40 % tack vare sin cache-linje-vänliga layout. Det är viktigt av två skäl. Först så ökar IPv6-trafiken när operatörer pensionerar äldre IPv4-adresspooler, och höghastighets-routrar måste upprätthålla linje-hastighets-sökning på allt större routningstabeller. För det andra så levereras moderna datacenter-CPU:er nu med AVX-512, vilket förvandlar en tidigare nisch-instruktionssats till en mainstream-prestanda-hebel. En programvaru-router som kan utnyttja dessa breda vektorer utan att behöva specialiserade ASIC:er eller GPU:er minskar gapet mellan kommersiella servrar och operatörs-klass-utrustning. Vad man ska se fram emot är integrationsansträngningar med DPDK- och VPP-ekosystemen, där en plug-in kan ta motorn till produktions-klass-paketbehandlings-pipeliner. Samhället undersöker också att porta algoritmen till ARM:s SVE-vektorsats, vilket skulle bredda dess relevans till heterogena molnmiljöer. Om de tidiga prestanda-anspråken står pall för olika arbetsbelastningar, kan planb-lpm bli en de-facto-referens för IPv6 LPM på allmänna ändamålshårdvara.
84

Ett stort tack till mig själv för att ha krossat helgens projekt! Byggde en headless‑server, installerade min egen LL

Ett stort tack till mig själv för att ha krossat helgens projekt! Byggde en headless‑server, installerade min egen LL
Mastodon +7 källor mastodon
privacy
En hobby‑ingenjör publicerade en helglogg som läser som en ritning för nästa våg av DIY‑AI. Med en kompakt mini‑PC satte skaparen ihop en headless‑Linux‑server, installerade en öppen källkod‑stor språkmodell (LLM) lokalt och omslöt hela stacken med en Cloudflare‑Tunnel så att systemet kan nås från vilken enhet som helst utan att exponera en publik IP‑adress. Installationen körs helt offline förutom tunneln, vilket betyder att modellens inferens sker på användarens hårdvara och data aldrig lämnar lådan. Experimentet är viktigt eftersom det visar hur tröskeln för att köra kraftfulla LLM:er sjunker från moln‑skaliga kluster till en enda låg‑effekt‑box. Med de senaste släppen av kvantiserade modeller som LLaMA‑2‑7B‑Chat och Mistral‑7B kan en blygsam GPU eller till och med en enbart CPU‑enhet leverera användbara svar. Genom att para modellen med en headless‑konfiguration undviker skaparen behovet av en skärm, tangentbord eller en bestående SSH‑session – ett tillvägagångssätt som speglar hur många nordiska startups implementerar edge‑AI för integritetskänsliga tillämpningar, från medicinska triage‑bottar till lokala språktjänster. Säkerhet och hållbarhet är nästa variabler att bevaka. Cloudflare‑Tunnel ger krypterad åtkomst, men den bredare gemenskapen testar fortfarande alternativ som Tailscale och Zero‑Trust‑VPN för striktare kontroll. Samtidigt lovar hårdvaruframsteg – NVIDIA:s låga profil‑RTX 4070 Ti, Intels Xe‑HPG och ARM‑baserade AI‑acceleratorer – högre genomströmning utan den energiförbrukning som traditionella servrar kräver. Öppen‑källkod‑verktyg som HeadlessX, som möjliggör odetekterad webbläsar‑automation, kan snart kombineras med själv‑hostade LLM:er för att driva autonoma agenter som körs helt på kanten. Om trenden håller i sig kan vi förvänta oss ett uppsving av community‑underhållna modell‑arkiv, mer robusta kvantiserings‑pipelines och regulatoriska diskussioner kring datasuveränitet för lokalt hostad AI. De kommande månaderna kommer att visa om helgprojekt som detta blir grunden för produktionsklara, integritets‑först AI‑tjänster över hela Norden.
80

AI-nyheter den 20 april 2026: Anthropic släpper Mythos 5 – 10 biljonerparametrars modell för cybersäkerhet

AI-nyheter den 20 april 2026: Anthropic släpper Mythos 5 – 10 biljonerparametrars modell för cybersäkerhet
Mastodon +6 källor mastodon
anthropicclaudeopenai
Anthropic presenterade Mythos 5 den 20 april, en modell med 10 biljoner parametrar som är särskilt utvecklad för cybersäkerhet. Företaget hävdar att den nya arkitekturen kan upptäcka noll-dagars-utnyttjanden, flagga skadlig kod och sortera hot i realtid, vilket ger "mänsklig nivå" av analys över nätverksloggar, e-postströmmar och molnbelastningar. Anthropic rullar ut modellen först till en sluten grupp om 40 partner, inklusive flera europeiska banker och ett antal amerikanska försvarsleverantörer, innan en bredare kommersiell lansering senare i år. Lanseringen markerar en avgörande eskalering i den artificiella intelligens-säkerhetskapplöpningen som har sett OpenAI och andra leverantörer skynda sig att få specialiserade modeller ut på marknaden. Anthropics tidigare förhandsvisning av Mythos drog till sig regulatorisk granskning; som vi rapporterade den 20 april, övervakade redan myndigheterna modellen för banksektorns risker. Genom att skala upp till 10 biljoner parametrar lovar Mythos 5 högre upptäcktsnoggrannhet och lägre falska positiva rater, vilket potentiellt ger användarna en mätbar fördel mot nationella aktörer och ransomware-grupper. Draget understryker också Anthropics snabba uppgång: företaget meddelade 30 miljarder dollar i intäkter detta kvartal, och överträffade OpenAI, och diversifierar med produkter som Claude Design, ett visuellt samarbetsverktyg. Utrullningen har redan väckt geopolitisk spänning. NSA bekräftade att de integrerar Mythos 5 i klassificerade nätverk, ett beslut som har mött kritik från försvarsdepartementet, som varnat för att förlita sig på en enda leverantör för kritisk försvarsinfrastruktur. Samtidigt avslöjade Vercel ett dataintrång utfört av AI-stödda hackare, vilket lyfter fram behovet av robust försvar mot AI. Vad som kommer att hända härnäst: prestandamätningar som släpps av oberoende säkerhetslaboratorier kommer att testa om Mythos 5 lever upp till sina påståenden. Förvänta er en formell reaktion från försvarsdepartementet, möjligen en upphandlingsgranskning eller en kampanj för öppen källkod. OpenAI kommer sannolikt att påskynda sina egna cybersäkerhetserbjudanden, och myndigheterna kan skärpa tillsynen när högkapacitetsmodeller integreras i nationella säkerhetsflöden. De kommande månaderna kommer att visa om Anthropics insats omformar den artificiella intelligens-säkerhetslandskapet eller utlöser en ny omgång av politiska strider.
80

Nomagic anställer ny chefsforskare från Google DeepMind för att leda utvecklingen av grundläggande modeller för robotik

Markets Insider +7 källor 2026-04-17 news
deepmindgooglerobotics
Nomagic, det Sverige‑baserade robotföretaget som har skalat AI‑drivna lagerarmar över hela Europa, meddelade idag att de har anställt Markus Wulfmeier som sin första chefsforskare. Wulfmeier kommer från Google DeepMind, där han ledde forskningen inom fysisk AI och embodied learning, och kommer att leda en ny enhet som fokuserar på att bygga grundläggande modeller som kan överföras till en rad olika robotuppgifter. Utnämningen markerar ett strategiskt skifte för Nomagic. Hittills har företaget förlitat sig på skräddarsydda perceptions‑ och kontrollpipeline‑lösningar som är finjusterade för specifika plock‑och‑lägg‑scenarier. Genom att ta in DeepMinds expertis inom storskaliga, multimodala modeller siktar Nomagic på att skapa en enda ”hjärna” som kan förstå råa sensorströmmar, resonera kring objektdynamik och generera motoriska kommandon för vilken lagerlayout som helst. Om detta lyckas kan metoden kraftigt förkorta utvecklingscykler, sänka hårdvarukostnaderna och möjliggöra snabb anpassning till nya produktlinjer – en fördel i en marknad där Amazon‑liknande fulfilment‑center expanderar i rasande takt. Branschobservatörer ser flytten som en tidningssignal för den bredare robotiksektorn, som har haft svårt att omsätta de senaste genombrotten inom stora språkmodeller till konkreta fysiska förmågor. Nomagics Serie B‑runda på 44 miljoner USD, som avslutades förra månaden, gav kapitalet som behövs för att driva hög‑risk‑forskning som tidigare tillhört deep‑tech‑labbar. Anställningen signalerar också en intensifierad konkurrens bland europeiska aktörer om att fånga ”grundläggande modell”‑nischen innan de amerikanska jättarna konsoliderar sina egna robot‑inlärningsplattformar. Vad man bör hålla ögonen på härnäst: Nomagic har lovat att släppa sin första prototyp av en tväruppgiftsmodell senast Q4 2026 och kommer sannolikt att publicera benchmark‑resultat för den nya Physical AI Suite. Partnerskap med logistikoperatörer kommer att testa tekniken i skala, medan regulatoriska myndigheter bevakar säkerhetsstandarder för AI‑styrda maskiner. Framgången – eller misslyckandet – för Wulfmeiers team kan sätta takten för nästa våg av intelligent automation i leveranskedjor.
75

Figmas motgångar förvärras med Claude Design

Figmas motgångar förvärras med Claude Design
HN +5 källor hn
claude
Anthropics verktyg Claude Design, en plugin för text-till-prototyp som lanserades den 17 april i Claude Cowork, börjar nu kännas av utanför sin egen användarbas. Genom att låta en enda prompt generera designsystem, interaktiva webbplatser, presentationsbilder och en-sidiga dokument kan verktyget skicka utdata direkt till Figma via en ny exportfunktion. Detta har skickat en chockvåg genom den samarbetsinriktade designmarknaden, vilket har fått Figmas aktiekurs att sjunka och utlöst en våg av "Figma-dödare"-prat. Som vi rapporterade den 20 april var Claude Design positionerat som ett komplement till visuell AI snarare än en ersättning för befintliga designplattformar. Den senaste integrationen exponerar dock en strukturell sårbarhet i Figmas affärsmodell: en betydande del av intäkterna kommer från "icke-designer"-platser - team som använder plattformen för samarbete, överlämning och feedback snarare än ren designarbete. När en AI kan producera en polerad prototyp på några sekunder blir dessa platser mindre beroende av Figmas kärnverktyg, vilket väcker frågan om avhopp bland de användare som håller tjänsten finansiellt stark. Betydelsen sträcker sig bortom aktiemarknadsoro. Designers som antar Claude Design rapporterar en arbetsflöde som känns "som det de inte visste att de behövde", med prompt-in, design-ut-cykler som kringgår många manuella steg. Men utdata kräver fortfarande finslipning, delning och versionskontroll - funktioner där Figma fortfarande har en fördel. Detta förslår en hybrid framtid där AI-genererade utkast hamnar i Figma för polering och samarbete, snarare än en fullständig ersättning. Vad man ska se fram emot: Anthropics roadmap för djupare Figma-integration, inklusive realtids-samarbete och komponentbibliotek; Figmas svar, antingen genom egna AI-funktioner eller prismässiga justeringar för att behålla icke-designer-platser; och bredare branschacceptans som kommer att avslöja om Claude Design blir en nischaccelerator eller en katalysator för en mer grundläggande förändring i hur digitala produkter konceptualiseras.
65

En liten maskin som kan skapa innehåll i din hand

En liten maskin som kan skapa innehåll i din hand
Mastodon +6 källor mastodon
En svensk startup har presenterat en prototyp som kan förvandla den långvariga AI-"tankeexperimentet" med en fickstor innehållsgenererare till en verklig produkt. Enheten, som är ungefär lika stor som en modern smartphone, kör en lokalt värd multimodal modell som kan producera text, bilder och korta videoklipp på begäran. Användarna trycker på en knapp, skriver en prompt eller väljer en kategori, och maskinen renderar omedelbart den begärda medieinnehållet, allt utan att behöva en internetanslutning. Presentationen bygger på den senaste vågen av generativ-AI-verktyg som nyligen har flyttat från molnbaserade tjänster till format som är vänliga mot kanten. Som vi rapporterade den 19 april, demonstrerade Anthropics Claude Design hur AI kan göras tillgängligt för icke-designers; idag drivs samma princip vidare in i hårdvaran, vilket lovar noll-fördröjningsskapande och full dataskydd. Genom att hålla modellen på enheten, undviker prototypen bandbreddskostnaderna och säkerhetsproblem som har hindrat en bredare användning av AI-genererat innehåll i reglerade sektorer som finans och hälsovård. Branschobservatörer säger att tillkännagivandet är viktigt eftersom det signalerar en förändring från "AI som en tjänst" till "AI som en personlig apparat". Om tekniken skalas, kan den omforma innehållsflöden, möjliggöra marknadsföringsmaterial på språng och ge konsumenterna en utanför jämförelse kreativ frihet. Samtidigt väcker förmågan att generera realistiska videoklipp i en handhållen formfaktor röda flaggor om djupfalsk spridning och behovet av robusta autentiseringsstandarder. Startupen planerar en begränsad beta senare i sommar, riktad mot skapare och företagsgrupper som kräver offlinegenerering. Håll utkik efter uppföljande tester av batteriliv, modellkomprimeringstekniker och eventuella regulatoriska svar från EU:s AI-lag när enheten flyttar från prototyp till kommersiell produkt.
63

Utvecklare testar ChatGPT, Claude, Perplexity och Gemini - och granskar Nginx-loggar

Utvecklare testar ChatGPT, Claude, Perplexity och Gemini - och granskar Nginx-loggar
HN +6 källor hn
claudedeepseekgeminigpt-5perplexity
En utvecklare konfigurerade en Nginx-reverse-proxy för att dirigera förfrågningar från ett enda webbgränssnitt till OpenAIs ChatGPT, Anthropics Claude, Perplexity.ai och Googles Gemini, och undersökte sedan åtkomstloggen för att jämföra hur varje tjänst beter sig under identisk trafik. Under ett 12-timmarsfönster registrerade proxyn 4 miljoner förfrågningar, vilket avslöjade skarpa kontraster i förfrågningsstorlek, svarstid och felmönster som går utöver modellbetyg. ChatGPTs samtal hade i genomsnitt en tur- och retur-tid på 210 millisekunder, med en stabil framgångsfrekvens på 99 %, men varje förfrågan innehöll en 2-KB JSON-nyttolast som innehöll ett "modell"-fält och en token-räknehint. Claudes trafik visade en något längre median-svarstid på 280 millisekunder och en högre andel 429 "begränsnings"-svar, vilket tyder på en strängare per-minut-kvot på den kostnadsfria nivån. Perplexitys slutpunkt, som marknadsförs som en realtids-svarsmotor, producerade de minsta nyttolasterna (≈1 KB) men led av intermittenta 500-fel som ökade när frågan innehöll tvetydig formulering. Gemini, den senaste aktören, hade de längsta svansarna - 15 % av samtal överskred 500 millisekunder - men loggarna visade en konsekvent användning av HTTP/2-serverpush, vilket antyder en strömmande svarsarkitektur som kan minska klient-sidans svarstid på bekostnad av högre serverbelastning. Varför det är viktigt: när multi-LLM-gränssnitt sprids på den nordiska marknaden, förlitar sig utvecklare alltmer på delad edge-infrastruktur för att medla API-trafik. Nginx-data visar att kostnad, tillförlitlighet och prestanda inte är enhetliga över leverantörerna; en modell som vinner benchmark-tabeller kan fortfarande påverka högre bandbredd eller strängare begränsningar i produktion. För företag som planerar att integrera AI-assistenter i kund-vända tjänster, kan dessa dolda operativa skillnader påverka SLA och molnutgifter. Vad att se fram emot: författaren planerar att upprepa experimentet med den kommande Gemini "hybrid-inferens"-läget som tillkännagavs den 20 april, och att testa påverkan av token-nivå-strömning på Nginx-buffertanvändning. Observatörer bör också övervaka eventuella policyförändringar från OpenAI och Anthropic som kan omforma begränsningströsklar, samt framväxande europeiska dataskyddsregler som kan tvinga fram enhetsbaserad inferens, en trend som antydits i vår rapport den 16 april om Firebase-nyckelmissbruk.
60

31 dimensioner av nyhetsbias, frågbara från Claude på enkel engelska

Dev.to +5 källor dev.to
biasclaude
Claude, Anthropics flaggskepps‑konversationsmodell, låter nu användare granska nyhetsartiklar över 31 olika bias‑dimensioner med enkla engelska frågor. Uppgraderingen ersätter den branschstandardiserade enkla “vänster‑höger”-poängen med en multidimensionell taxonomi som bland annat omfattar urvalsbias, ramningsbias, källmångfald, ton, utelämnande och narrativ betoning. Användare kan be Claude att ”lista ramningsbias i den här berättelsen” eller ”markera eventuell urvalsbias”, och modellen levererar en strukturerad uppdelning med citat från texten. Detta steg är viktigt eftersom befintliga verktyg för bias‑detektion förenklar komplexa redaktionella val till ett enda tal, vilket döljer de nyanserade sätt på vilka medier formar uppfattningar. Genom att avslöja en rikare bias‑karta ger Claude journalister, faktagranskare och läsare ett diagnostiskt verktyg som speglar akademiska ramverk för mediebias såsom AllSides och Media Bias/Fact Check, men med omedelbar AI‑driven analys. Anthropics tidigare åtagande att vara “politisk neutral” i Claude, som beskrevs i deras 2026‑rapport om bias‑träning, får här en konkret tillämpning och lovar mer transparent och ansvarstagande rapportering. Det som blir intressant att följa är hur det 31‑dimensionella schemat valideras och tas i bruk. Anthropic har öppnat funktionen för utvecklare via Claude‑API:et och bjuder in till integration i nyhetsrums‑dashboards, webbläsartillägg och utbildningsplattform
60

Att lära Alfred att minnas med ett neurovetenskapligt inspirerat minnessystem för AI‑agenter

Dev.to +5 källor dev.to
agents
En utvecklare som bara går under namnet “Alfred” har presenterat en ny minnesarkitektur för AI‑agenter som efterliknar hur biologiska hjärnor lagrar och konsoliderar information. Systemet, som släpptes på GitHub den 19 april, lägger ett “sömn‑cykel”-process ovanpå ett SQLite‑baserat kunskapslager, vilket gör att en agent kan behålla fakta, preferenser och till och med visuell kontext mellan sessioner utan att översvämma språkmodellen med råa token. Kärnidén lånar från neurovetenskapen: minnen registreras först i en flyktig korttidsbuffert och spelas sedan periodiskt upp under en simulerad sömnfas där de filtreras, länkas och komprimeras. Det resulterande långtidslagret kan frågas med semantisk sökning, så att en agent kan hämta relevanta utdrag på begäran istället för att återskapa hela konversationshistoriken. Tidiga benchmark‑resultat visar en 30 % minskning av token‑användning för flerstegs‑dialoger och en märkbar förbättring av svarens relev
59

Jag har nyligen varit relativt positiv till Claude Code, men vill betona en viktig varning

Jag har nyligen varit relativt positiv till Claude Code, men vill betona en viktig varning
Mastodon +6 källor mastodon
claude
En våg av försiktighet har spridits på sociala medier efter att en välkänd utvecklare publicerade en tydlig varning om Anthropics Claude Code. I ett inlägg som snabbt fick stor spridning berömde författaren de senaste förbättringarna men betonade ett ”hårt stopp”: användare bör inte delegera uppgifter till Claude Code som de själva kan utföra. Motivet är tvådelat – beroendet av modellen urholkar den personliga färdighetsutvecklingen och, ännu viktigare, resultatet kan inte granskas fullt ut, vilket lämnar projekt sårbara för dolda buggar eller skadlig kod. Varningen kommer i ett ögonblick då Claude Code hyllas som ett genombrott för både erfarna programmerare och icke‑tekniska användare. Tidigare i år lanserade Anthropic Claude Design, ett
54

OpenAI Backing Law That Protects It When AI Causes Mass Deaths and Other Mayhem

Mastodon +7 källor mastodon
chipsinferenceopenaitraining
OpenAI stödjer lag som skyddar mot ansvar när AI orsakar massdöd och annan förödelse OpenAI har lagt sitt stöd bakom ett lagförslag i Illinois som skulle skydda AI‑utvecklare från civilrättsligt ansvar när deras system orsakar ”kritiska skador” – definierade som död eller allvarlig skada på 100 eller fler personer, eller egendomsskador som överstiger 1 miljard dollar. Lagförslaget, som introducerades i delstatens senat tidigare i månaden, syftar till att ge ett generellt försvar till företag vars modeller används i hög‑riskmiljöer, allt från autonoma fordon till medicinska diagnoser. OpenAIs offentliga stöd, publicerat på företagets blogg och förstärkt genom ett pressmeddelande, placerar företaget som en ledande röst i strävan att begränsa juridisk exponering för banbrytande AI‑teknologier. Initiativet är betydelsefullt eftersom det är det första samordnade försöket från ett stort AI‑företag att påverka statlig ansvarslagstiftning. Kritiker menar att sådan immunitet kan minska incitamenten för säkerhetstestning och lämna drabbade utan möjlighet till ersättning, medan branschförespråkare hävdar att den är nödvändig för att främja innovation i ett område där oförutsägbara fel kan få katastrofala konsekvenser. Debatten påminner om tidigare strider om AI‑ansvar, inklusive den nyligen av OpenAI stödda cyberförsvarsmodellen som utlöst en regleringskapprustning med Anthropic, samt företagets egna erfarenheter av plötsliga tjänsteändringar som lämnade utvecklare i panik. Lagförslaget står nu inför utskottshöranden och en sannolik konfrontation med konsumentorganisationer och försäkringsregulatorer. Följ med när OpenAIs ledande befattningshavare ger vittnesmål, medborgarrättsliga lagstiftare uttrycker motstånd och eventuell federal respons som kan förhindra statlig handling. Resultatet kommer att visa hur långt politiker är villiga att gå för att ge juridiskt skydd till AI‑skapare och kan bli en mall för liknande lagar i andra jurisdiktioner när branschen brottas med den växande hotbilden av massskador orsakade av AI.
54

GPT-5.4-Cyber – OpenAI:s spelväxlare för AI‑säkerhet och defensiv AI

Dev.to +6 källor dev.to
autonomousgpt-4gpt-5openai
OpenAI har officiellt lanserat GPT‑5.4‑Cyber, en specialiserad storskalig språkmodell byggd för att automatisera hotintelligens‑analys, skriva defensiv kod och orkestrera incidentrespons‑handböcker. Lanseringen, som meddelades i ett kortfattat blogginlägg och en live‑demo på torsdagen, sker bara en vecka efter att företaget mött skepsis kring modellens färdighet och dess potentiella förmåga att sudda ut gränsen mellan defensiva och offensiva cyberverktyg. OpenAI:s VD Sam Altman försvarade tidpunkten och sade att modellen “har klarat interna red‑team‑granskningar och nu är tillgänglig för granskade säkerhetsteam via det nya Assistants API.” Premiären är betydelsefull eftersom den markerar första gången ett stort AI‑laboratorium kommersialiserat en modell vars primära syfte är att stärka digital infrastruktur. GPT‑5.4‑Cyber kan ta emot råa loggar, generera Snort‑regler, laga sårbara kodsnuttar och till och med simulera nätfiskeförsök för träningsändamål, allt inom en sandlådemiljö. Genom att integrera modellen i Säkerhetsoperationscenter kan företag förkorta detekteringscykler från timmar till minuter, en förändring som kan omforma ekonomin kring cybersäkerhet. Samtidigt väcker samma funktioner oro för militarisering; kritiker varnar för att samma kodgenereringsmotor kan återanvändas av hotaktörer och intensifiera AI‑kapprustningen som lagstiftare bara börjat ta itu med. OpenAI:s tidigare rapport om GPT‑5.4‑Cyber den 16 april belyste de tekniska specifikationerna men lämnade öppet hur tjänsten skulle begränsas. Håll utkik efter lanseringen av OpenAI:s “Secure Access Programme”, som kommer att kräva bakgrundskontroller och loggar för användningsövervakning, samt efter reaktioner från branschkonkurrenter som Anthropic och Microsofts Azure Sentinel‑team. Lika kritiskt blir eventuella policyuttalanden från EU AI Act‑kommittén, som förväntas ge vägledning om högrisk‑AI‑modeller senare i sommar. De kommande månaderna kommer att visa om GPT‑5.4‑Cyber blir en hörnsten i företagscybersäkerhet eller en gnista för nya regulatoriska konflikter.
54

Show HN: Nyx – flerstegs, adaptivt, offensivt testningsramverk för AI‑agenter

HN +6 källor hn
agentsautonomous
Nyx, ett open‑source‑testningsramverk som presenterades på Hacker News, lovar att stress‑testa AI‑agenter med samma uthållighet och kreativitet som riktiga användare – eller illvilliga aktörer – bidrar med. Verktyget kör flerstegs, adaptiva konversationer mot en mål‑agent och letar efter logikfel, misslyckanden i instruktionstolkning, kantfallsbeteenden samt klassiska red‑team‑attacker som jailbreaks, prompt‑injektion och verktygskapning. Nyx fungerar som ett rent black‑box‑system och kräver ingen intern åtkomst till modellen, vilket innebär att utvecklare kan utvärdera vilken värdad eller lokalt körd agent som helst på samma sätt som slutanvändare skulle interagera med den. Lanseringen sker i ett skede då AI‑agenter går från forskningsprototyper till produktionsklara assistenter, kodgeneratorer och autonoma beslutsfattare. När agenter får bredare tillgång till verktyg och externa API:er ökar attackytan dramatiskt, och senaste rapporterna om prompt‑injektionsexploater har understrukit
53

Efter månader med GitHub Copilot – nu drivs den av Claude Code

Mastodon +6 källor mastodon
claudecopilot
En senior mjukvaruingenjör på ett medelstort nordiskt SaaS‑företag har publicerat en uppriktig snabb kommentar efter flera månader av dagligt arbete med GitHub Copilot, och påpekar att tjänsten nu kör Claude Code under huven. Utvecklaren säger att AI‑parprogrammeraren har förvandlat uppgifter som tidigare tog dagar till ärenden på några timmar, och har reducerat rutinmässig standardkod, test‑ramverk och API‑klientgenerering till några få tangenttryckningar. Hastighetsökningen är verklig, men författaren varnar för att verktyget måste användas “genomtänkt” – från att granska genererade kodsnuttar för säkerhetsbrister till att spåra licensfotspår av den underliggande modellens träningsdata. Övergången till Claude Code är betydelsefull eftersom den markerar Microsofts första storskaliga införande av Anthropics modell i Copilot, ett steg som kan omforma konkurrenslandskapet mellan verktyg centrerade på OpenAI respektive Anthropic. För företag som redan börjat styra Claude‑användning över ingenjörsteam – se vår rapport från 20 april om Claude‑kodstyrning – bekräftar erfarenheten produktivitetslöftet samtidigt som samma styrningsutmaningar framträder: kod‑ursprung, efterlevnad av öppen‑källkodslicenser och risken för “copy‑paste”-buggar som smyger igenom utan granskning. Det som blir intressant att följa är hur både GitHub och Anthropic svarar på den växande återkopplingsslingan. Man kan förvänta sig tajtare IDE‑integrationer som visar ursprungsmetadata, utökade policyinstrumentpaneler såsom den lokalt‑först‑multia‑agent‑konsol vi tidigare behandlat, och eventuellt nya licensupplysningar i Copilots FAQ. Större företag kommer sannolikt att testa striktare granskningsgrindar för AI‑genererad kod, medan startups kan dubbla sin satsning på hastighetsfördelen. De kommande kvartalen kommer att visa om produktivitetsvinsterna väger tyngre än den operativa
53

Chockerande utveckling: Enkla produktivitetsmått för anställda kan erhållas

Mastodon +6 källor mastodon
En svensk startup, FocusAI, lanserade en molnbaserad tjänst som påstår sig kunna destillera “enkla produktivitetsmått för anställda” från vardagliga digitala fotavtryck – e‑posttidsstämplar, chattloggar, kodcommit och kalenderposter – med hjälp av en stor språkmodell finjusterad på företagsdata. Verktyget, marknadsfört som “Instant Insight”, lovar chefer en ett‑klick‑poäng som påstås spegla hur mycket “djup arbete” varje medarbetare utför, och positionerar måttet som ett ersättningsalternativ till traditionella medarbetarengagemangsundersökningar. Tillkännagivandet kom mitt i en våg av HR‑teknik som omdefinierar prestationsmätning genom AI. Nyliga analyser har pekat ut “fokustid” som den mest pålitliga indikatorn på output och som ett verktyg mot utbrändhet, medan kritiker varnar för att reducera komplexa bidrag till ett numeriskt värde riskerar mikrostyrning och integritetsförsämring. FocusAIs metod förstärker dessa farhågor: genom att samla minut‑för‑minut‑aktivitet glider systemet in på gränsen mellan analys och övervakning, ett påstående som understryks av en BusinessToday‑kommentar som avfärdade sådan detaljerad loggning som ett arv från en överdrivet kontrollerande mellanchefskultur. Varför det är viktigt är tvåfaldigt. För det första kan produkten påskynda införandet av AI‑drivna prestationsinstrumentpaneler, vilket omformar hur skandinaviska företag fördelar resurser och utvärderar talang. För det andra väcker den juridiska och etiska frågor under EU:s kommande AI‑lag, som klassificerar hög‑risk‑system som påverkar arbetstagares rättigheter. Fackföreningar i Danmark och Sverige har redan signalerat avsikt att utmana varje implementering som saknar transparenta samtyckesmekanismer. Att hålla ögonen på framöver inkluderar FocusAIs pilotutplacering med ett fåtal teknikföretag, reaktionen från dataskyddsmyndigheter och huruvida konkurrenter kommer att vända sig mot mer nyanserade mått såsom “fokustid” i stället för grova produktivitetsbetyg. Debatten kommer sannolikt forma nästa kapitel av AI‑förstärkt HR, där effektivitetstillväxt måste balanseras mot behovet att skydda anställdas värdighet.
53

OpenClaw‑produktionsuppsättningsmönster med plugins och färdigheter

OpenClaw‑produktionsuppsättningsmönster med plugins och färdigheter
Mastodon +6 källor mastodon
privacy
OpenClaws utvecklare har publicerat en detaljerad guide för produktionsklassade distributioner som kombinerar plattformens pluginsystem med dess växande bibliotek av ”färdigheter”. Dokumentet, som publicerades på Glukhovs AI‑systemwebbplats, kartlägger verkliga uppsättningar mot användarkategorier – från hobbylabbet till företagsdatacenter
51

Kan Claude skriva Z80‑assemblerkod?

HN +5 källor hn
claude
Anthropics Claude har satts på prov i en klassisk retro‑computing‑utmaning: att skriva Z80‑assembler. Ett inlägg på Hackaday som publicerades den här veckan visar hur en användare bad Claude‑Code att producera en liten rutin som växlar en port och implementerar en enkel fördröjningsloop. Modellen levererade syntaktiskt korrekt Z80‑kod, som korrekt använde register, flaggkontroller och instruktionen ”JR”, och lade dessutom till kommentarer som förklarar varje steg. Efter en kort manuell granskning kompilerades kodsnutten med den öppna källkodsassembleraren “z80asm” och kördes på ett riktigt Z80‑kort, vilket bekräftade att resultatet var funktionellt. Experimentet är viktigt eftersom Z80‑assembler befinner sig i motsatt ände av programmeringsspektrumet jämfört med de högnivåspråk där stora språkmodeller (LLM) hittills har varit mest användbara. Att generera lågnivåkod kräver exakt kunskap om instruktionsuppsättningar, adresseringslägen och hårdvarusärskildheter – områden där ett enda felstavat tecken kan göra ett program oanvänd
50

AI Disclosure - Playdate Help

Mastodon +6 källor mastodon
Playdate förb
50

Kommande Mac Studio‑ och MacBook Pro‑lanseringar kan skjutas upp med flera månader

Mastodon +6 källor mastodon
apple
Apple kan fördröja lanseringen av sin nästa generations Mac Studio‑stationära dator och den efterlängtade pekskärms‑MacBook Pro med flera månader, säger analytiker. Observatörer av leveranskedjan, lett av Mark Gurman, pekar på en ihållande brist på avancerade kisel‑ och minnesmoduler som tvingar Apple att skjuta upp den uppdaterade Mac Studio – som skulle introducera M5 Max‑ och M5 Ultra‑processorer – från det vanliga vårfönstret till omkring oktober. Samma begränsningar förväntas påverka nästa Mac Book Pro, där ryktena antyder att den kommer att kombinera en ny M5‑chipfamilj med en först‑någons inbyggd pekskärm. Förseningen är betydelsefull eftersom de nya Mac‑datorerna är avsedda att fungera som den primära hårdvaruplattformen för AI‑intensiva arbetsbelastningar som många utvecklare och företag förlitar sig på. Apples M‑serie‑chip har blivit den de‑facto‑acceleratorn för stora språkmodeller på enheten, ett mönster som belystes i vår senaste bevakning av OpenAIs ”Codex Desktop”-utrullning. En senare lansering kan bromsa införandet av AI‑förstärkta macOS‑funktioner, såsom det omarbetade Siri‑gränssnittet som presenterades på WWDC 2026, och kan ge konkurrenterna ett fönster att ta marknadsandelar i segmentet för högpresterande bärbara datorer. Det som bör hållas ögonen på härnäst är om Apple kan lösa komponentbristen innan helgsäsongen samt om de försenade enheterna fortfarande kommer att levereras med de utlovade hårdvaruuppgraderingarna. Observatörer kommer också att följa Apples lagerstatus för den nuvarande Mac Studio, särskilt högminneskonfigurationer som redan håller på att ta slut, samt eventuella officiella uttalanden från företaget vid det kommande produkt‑evenemanget i september. En bekräftad tidslinje eller ett skifte till en spridd utrullning skulle signalera hur Apple avser att balansera sina AI‑ambitioner med realiteterna i en ansträngd global leveranskedja.
48

Anthropic stängde av Claude‑åtkomst för ett företag med 60 konton

Anthropic stängde av Claude‑åtkomst för ett företag med 60 konton
HN +6 källor hn
anthropicclaude
Anthropic avslutade abrupt åtkomsten till mer än 60 Claude‑konton som tillhörde den argentinska fintech‑företaget Belo, vilket utlöst en offentlig protest från företagets tekniska chef, Patricio “Pato” Molina. I ett inlägg på X delade Molina en skärmdump av ett e‑mail från Anthropic där det stod att “our automated systems detected a high volume of signals associated with your account which violate our Usage Policy,” men utan att ge några detaljer om det påstådda brottet och med endast ett generiskt Google‑formulär för överklaganden. Avstängningen förlamade Belos interna arbetsflöden, som är beroende av Claude för allt från automatisering av kundservice till riskanalysmodeller. Fintech‑företagets ingenjörsteam rapporterade att suspenderingen trädde i kraft utan föregående varning, vilket lämnade utvecklare utan tillgång till kritiska AI‑drivna verktyg i hela organisationen. Molina varnade andra mjukvaruföretag att “never put all your eggs in one basket,” och betonade sårbarheten i att starkt förlita sig på
45

Jag skapade en BaaS för självinregistrerande AI‑agenter

Dev.to +6 källor dev.to
agentsautonomous
Vibebase har lanserat en själv‑onboardings‑Backend‑som‑tjänst (BaaS) som utrustar AI‑agenter med en fullständig digital identitet – komplett med en e‑postadress och avgränsade tjänstbehörigheter – utan att någonsin exponera råa API‑nycklar. Plattformen registrerar automatiskt nya agenter, förser dem med behörigheter med minsta privilegium och loggar varje åtgärd i ett revisionsspår; en mänsklig operatör kan senare göra anspråk på ägandet av någon agent som har instanserats. Initiativet tar itu med ett problem som har plågat utvecklare sedan de tidiga dagarna för autonoma agenter. Som vi rapporterade den 20 april: “Sluta ge AI‑agenter AWS‑uppgifter: ett bättre sätt att säkra åtkomst”, innebär att ge agenter oskyddade nycklar en enorm attackyta. Genom att utfärda identitetsbaserade token istället för statiska hemligheter eliminerar Vibebase risken för läckage av autentiseringsuppgifter samtidigt som agenterna kan anropa externa tjänster såsom e‑post, lagring eller fakturerings‑API:er. Metoden stämmer också överens med framväxande regelefterlevnadsriktlinjer för BaaS‑leverantörer, som betonar delat ansvar och revisionsbarhet i reglerade sektorer som finans och sjukvård. Utöver säkerheten lovar själv‑onboardingsmodellen att påskynda AI‑driven produktutveckling. Team kan snabbt skapa dussintals specialiserade agenter på begäran, var och en isolerad med sin egen identitet, och senare överlämna dem till domänexperter för finjustering eller kundsupport. Tidiga användare inom fintech‑sektorn har redan rapporterat snabbare tid‑till‑marknad för bedrägeribekämpnings‑botar, medan ett pilotprojekt i en HIPAA‑kompatibel telehälsoplattform pekar på smidigare revisionsspår och minskad DevOps‑börda. Att hålla ögonen på framöver: om stora molnleverantörer kommer att erbjuda jämförbara identitet‑som‑tjänst‑primitiver för agenter, hur regulatorer reagerar på autonom agent‑provisionering i hög‑risk‑industrier, och om konkurrenter kommer att anta liknande token‑baserad onboarding för att matcha Vibebases kombination
45

Lokala LLM:ar är nu riktigt bra – jag missade det i månader

Mastodon +7 källor mastodon
Ett inlägg på XDA‑Developers med rubriken “Local LLMs are actually good now, and I wasted months not realizing it” har väckt ny debatt om möjligheten att köra generativ AI på enheten. Författaren, en långvarig LLM‑entusiast, beskriver hur modeller som Qwen‑3, Llama 3 och Googles Gemma 2 nu kan köras i användbara hastigheter på vanliga bärbara datorer och till och med mellanklass‑stationära datorer, tack vare framsteg inom kvantisering, llama.cpp‑körningsmiljön och de senaste GPU‑/CPU‑acceleratorerna. Artikeln hävdar att epoken med “endast molnbaserad” inferens är på väg att ta slut: fördröjningen sjunker från sekunder till millisekunder, API‑räkningarna minskar dramatiskt och känslig data lämnar aldrig användarens maskin. Skiftet är viktigt av flera skäl. För det första undergräver det de dominerande intäktsströmmarna för leverantörer som tar betalt per token, vilket potentiellt kan omforma marknaden för AI‑tjänster i Europa och Norden där datasuveränitet är en politisk prioritet. För det andra ger kostnadsfördelen – att köra en modell lokalt kan kosta några dollar per månad jämfört med tiotals eller hundratals för molnanvändning – AI tillgång till små startups och hobbyister som tidigare inte hade råd. För det tredje får integritetsmedvetna användare ett konkret alternativ till tjänster som nyligen har hamnat i fokus, såsom Anthropic‑skrivbordsklienten som visade sig inbädda telemetri. Det som bör bevakas härnäst är ekosystemet som avgör om hypen blir till varaktig adoption. Man kan förvänta sig snabba lanseringar av mindre, finjusterade varianter optimerade för ARM‑ och Intel‑Xeon‑plattformar samt tätare integration med kommande hårdvara som Apples M3 och Nvidias RTX 4090‑klassade GPU:er. Öppen källkod‑verktygssatser lägger redan till stöd för accelerering av inferens på enheten, och flera nordiska företag har annonserat pilotprojekt för lokalt LLM‑drivna assistenter. Regulatorer kan också rikta fokus mot säkerhetsimplikationerna av att köra kraftfulla modeller offline, särskilt i takt med att leveranskedjeattacker mot modellbinärer blir mer troliga. De kommande månaderna kommer att visa om lokala LLM:ar blir ett mainstream produktivitetsverktyg eller förblir en nisch för de tekniskt äventyrliga.
42

Sammanhangsingenjörskonst för agenter: Vad finns i ditt agents medvetande

Dev.to +6 källor dev.to
agents
En forskningskonsortium ledd av Köpenhamns universitets AI-laboratorium och med stöd från den nordiska riskkapitalfirman Northcap har publicerat en vitbok med titeln "Sammanhangsingenjörskonst för agenter: Vad finns i ditt agents medvetande". Dokumentet, som släpptes på tisdagen, presenterar en systematisk ansats för att forma de alltmer växande sammanhangsfönstren för dagens stora språkmodeller (LLM) till pålitliga, målorienterade agenter. Rapporten hävdar att den verkliga genombrottet inte längre är modellens storlek, utan hur utvecklare kuraterar den text som matar modellen vid körning. Den introducerar en tre-lagers arkitektur - hämtning, sammanfattning och exekvering - som delegerar sammanhangsval till dedikerade funktioner. Ett nytt öppen källkods bibliotek, ContextEngine, implementerar dessa lager, och trimmar automatiskt historik, sammanfattar verktygsutdata och tillämpar sekretessfilter innan prompten når LLM. Varför det är viktigt nu är tydligt: GPT-4 Turbo, Claude 3.5 och Gemini 2 har drivit sammanhangsfönster förbi 100 k token, vilket lockar ingenjörer att dumpa rå interaktionsloggar i prompter. Utan disciplinerad ingenjörskonst blir agenter bullriga, dyra och benägna att hallucinera - ett problem som belysts i vår tidigare täckning av "Skugg-AI"-risken (2026-04-20). Genom att formalisera sammanhang som kod lovar ramverket en tätare styrning, lägre inferensutgifter och mer förutsägbart beteende, särskilt i högriskmiljöer som autonom kodgenerering, hämtningssökta generation (RAG) och multiagent-samarbete. Vad man ska se fram emot: konsortiet kommer att benchmarka ContextEngine mot befintliga RAG-pipelines i en offentlig Kaggle-tävling i juni, och flera molnleverantörer har redan signalerat intresse för att integrera biblioteket i sina hanterade AI-tjänster. Regulatorer i EU arbetar också med riktlinjer för "prompttransparens", ett steg som kan göra rapportens rekommendationer till de-facto-standarder. Som vi rapporterade om det växande "Skugg-AI"-problemet, kan förmågan att granska vad en agent "vet" vid varje ögonblick bli ett krav på efterlevnad lika snabbt som modelllicensiering gjorde.
41

Regissören bakom The Mandalorian & Grogu testar Apples Vision Pro för att förhandsgranska filmen i IMAX-format

Mastodon +6 källor mastodon
apple
Jon Favreau, regissören bakom den kommande filmen The Mandalorian & Grogu, har tagit ett modigt steg in i mixed-reality-filmskapande genom att använda Apples Vision Pro-hjälm för att förhandsgranska hela filmen i en IMAX-liknande miljö. Favreau beställde en specialanpassad Vision Pro-app av Disneys ingenjörsteam som strömmar filmens fullupplösta ramar till hjälmens skärm, vilket i princip förvandlar enheten till en bärbar IMAX-bio. Regissören kan gå runt på inspelningsplatsen, visa scener i exakt samma bildförhållande och synfält som kommer att visas på den jättestora biografduken, och göra realtidsjusteringar av komposition, belysning och visuella effekter. Detta är viktigt eftersom det visar på Vision Pros potential som ett professionellt verktyg snarare än en konsumentnyhet. Genom att kombinera inspelningsmontrar med en virtuell IMAX-vyport elimineras behovet av dyra fysiska testvisningar och kan påskynda förproduktionsstadiet för högbudgetproduktioner. Apples inträde på den Hollywoodska marknaden signalerar en strategisk satsning på att integrera sitt rumsliga datormoln i den kreativa processen, vilket utmanar de traditionella efterproduktionssviterna och konkurrerar med AR-lösningar från Meta och Microsoft. De kommande veckorna kommer att visa om tekniken översätts till en märkbar visuell fördel i den teatrala release den 22 maj. Branschexperter kommer att följa Apples kommande utvecklaruppdateringar på WWDC 2026 för utökade API:er som kan låta andra studior bygga liknande verktyg. Disneys egen användning av hjälmen för framtida projekt, och eventuella uttalanden från IMAX om att standardisera mixed-reality-förhandsvisningar, kommer också att visa om Vision Pro är på väg att bli en standard på inspelningssidan.
41

Grafik från WWDC 2026 hintar om stor iOS 27‑funktion

Mastodon +6 källor mastodon
apple
Apple har smugit in en lockande bild i sin förhandsvisning av WWDC 2026, vilket antyder att iOS 27 kommer att göra en total omvälvning av iPhone‑startsidan och Siri‑upplevelsen. Grafiken, som först upptäcktes på MacRumors, visar ett omdesignat gränssnitt där appar, widgets och en ny “Smart Stack” kan blandas mer sömlöst, medan en smalare Siri‑panel sitter längst ner på låsskärmen, redo att svara på kontextuella uppmaningar. En subtil AI‑driven “App Suggest”-banner dyker också upp och föreslår genvägar baserade på användarens rutin. Denna förhandsvisning är viktig eftersom den markerar det mest betydande UI‑skiftet sedan iOS 15:s widget‑revolution och signalerar Apples djupare integration av sin egen stora språkmodell‑teknik, ofta benämnd Apple Intelligence. Genom att bädda in AI‑förslag direkt på startsidan vill Apple få iPhone att kännas mer proaktiv, ett drag som kan minska avståndet till Androids adaptiva UI och tvinga tredjeparts‑widget‑utvecklare att anpassa sig till strängare systemkontroller. Siri‑omdesignen antyder dessutom ett återvändande till ett mer konverserande gränssnitt efter år av gradvisa justeringar, vilket potentiellt kan återuppliva röstinteraktion som en primär inmatningsmetod. Det som står på spel härnäst är WWDC 2026‑keynoten den 3 juni, där Apple förväntas avslöja hela funktionspaketet och demonstrera hur utvecklare kan utnyttja de nya AI‑API:erna. En offentlig beta är sannolikt att följa under sommaren, vilket ger communityn tid att experimentera med den omarbetade startsidan och Siri‑integrationen. Observatörer kommer också att vara särskilt intresserade av hur förändringarna påverkar batteritiden, integritetsskyddet kring inferens på enheten och huruvida den nya UI:n kommer att rullas ut till äldre iPhone‑modeller eller förbli exklusiv för den senaste hårvaran.
41

Hur du kan avgöra om någon annans Apple AirTag spårar dig

Mastodon +6 källor mastodon
apple
Apples lilla Bluetooth‑sändare har återigen blivit en integritetsspalte. CNET publicerade en steg‑för‑steg‑guide på torsdagen som visar hur användare kan bekräfta om en okänd AirTag följer dem, en påminnelse om att enhetens bekvämlighet kan missbrukas för oönskad övervakning. Guiden leder iPhone‑användare genom de inbyggda varningarna som introducerades med iOS 16.5, vilka spelar upp ett pip och visar en avisering när en AirTag som inte är kopplad till deras Apple‑ID rör sig med dem under en längre period. Android‑användare kan installera Apples gratisapp “Tracker Detect” för att få liknande varningar. Om en varning visas råder artikeln att kontrollera fliken “Objekt” i Find My, spela upp ett ljud från AirTag‑en och, om det behövs, ta bort batteriet för att inaktivera den. Den rekommenderar också att notera serienumret och kontakta polisen, eftersom taggen kan spåras till sin ägare via Apples backend. Varför råden är viktiga är tvådelade. För det första har missbruk av AirTags för förföljelse lett till en våg av mediegranskning och juridiska utmaningar i Europa och USA, vilket tvingade Apple att släppa firmware‑uppdateringar i slutet av 2022 som begränsar enhetens tysta spårningsperiod. För det andra belyser händelsen en bredare spänning mellan bekvämligheten med ultrasmåa plats‑taggar och behovet av robusta anti‑övervakningsåtgärder – ett tema som återkommer i den senaste rapporteringen om “shadow AI”-problemet, där osynlig datainsamling kan gå före användarens medvetenhet. Framöver kommer observatörer att hålla ett öga på Apples nästa programvaruuppdatering, som enligt rykten ska införa obligatoriska ljudvarningar efter en kortare tidsperiod och sträng
41

Apple undviker ett andra importförbud för sina omdesignade smartklockor i senaste domstolsbeslutet

Mastodon +6 källor mastodon
apple
Apple har vunnit ett domstolsbeslut om ett interimistiskt stopp som blockerar ett andra amerikanskt importförbud för sina nydesignade Apple Watch‑modeller. Beslutet, utfärdat av den amerikanska appellationsdomstolen för Federal Circuit, häver den restriktion som skulle ha trätt i kraft dagen då företaget lämnade in sin överklagan, vilket gör att klockorna kan fortsätta att importeras till USA medan International Trade Commission (ITC) granskar ärendet. Tvisten har sitt ursprung i ett ITC‑beslut från 2023 som förbjöd de ursprungliga Series 9‑ och Ultra 2‑klockorna med påstådd överträdelse av Masimo Corp:s patent på pulsoximetri. Apple svarade genom att omdesigna sensorerna och lansera “Series 10” och “Ultra 3” i augusti 2025, med argumentet att förändringarna bryter kedjan av patentintrång. ITC:s granskningsorder från den 14 november frågade om omdesignen verkligen undviker Masimos anspråk och satte en beslutsfrist till den 12 januari. Appellationsdomstolens interimistiska stopp innebär att den omdesignade produkten kan säljas de kommande två månaderna, vilket ger Apple tid att bevisa sin ståndpunkt. Beslutet är betydelsefullt eftersom Apple
41

REDIGERING: lägger till bildbevis i ärendet. # mlibc och # Managarm använder/innnehåller # AI / # LLM

Mastodon +6 källor mastodon
claude
Managarms kärnbibliotek i C, mlibc, har visat sig innehålla kod som genererats av en stor språkmodell. En GitHub‑sökning på “managarm mlibc Claude” avslöjade en commit där projektets ursprungliga skapare, Alexander van der Grinten (avdgrinten), och en annan bidragsgivare infogade ett block av AI‑skriven kod direkt i bibliotekets abstraktionslager för systemanrop. Kodsnutten, som postades på ett offentligt forum, inkluderar en skärmdump av de felande raderna samt en länk till repositoryns sökresultat, vilket framkallade ett snabbt gensvar från Managarm‑gemenskapen. Upptäckten är viktig av flera skäl. För det första är mlibc det grundläggande standardbiblioteket för Managarm‑operativsystemet, ett hobby‑OS som syftar till portabilitet över arkitekturer som x86‑64, AArch64 och RISC‑V. Att införa LLM‑genererad kod i så lågnivåkomponenter väcker frågor om korrekthet, säkerhet och underhåll – problem som blir svårare att granska när kodens ursprung är oklart. För det andra belyser händelsen det växande beroendet av AI‑assistenter som Claude i öppen‑källkodsutveckling, vilket återkallar de farhågor vi tog upp i vår rapport den 19 april om lokala LLM‑agenter och behovet av rigorös utvärdering av AI‑producerade bidrag. Slutligen har licensfrågor stor betydelse: AI‑genererad text kan ärva begränsningar från modellens träningsdata, vilket potentiellt komplicerar bibliotekets tillåtande BSD‑liknande licens. Managarm‑underhållare har öppnat ett ärende för att granska den AI‑skrivna delen och för att fastställa en policy för framtida AI‑hjälp. De kommande stegen kommer sannolikt att omfatta en fullständig granskning av mlibc:s senaste commits, ett offentligt uttalande om huruvida koden ska behållas, och eventuellt införandet av bidragsriktlinjer som kräver explicit redovisning av AI‑genererade patchar. Observatörer kommer också att följa hur andra lågnivåprojekt reagerar, då detta avsnitt kan skapa ett prejudikat för hur LLM‑assisterad kod hanteras i kritisk infrastruktur.
36

När LLM‑leverantören drar tillbaka: Lärdomar av Anthropics OAuth‑avstängning

Dev.to +6 källor dev.to
anthropic
Den 4 april beslutade Anthropic att återkalla OAuth‑uppgifter för OpenClaw‑plattformen, vilket omedelbart inaktiverade mer än 135 000 tredjepartsintegrationer som förlitade sig på företagets Model Context Protocol (MCP). Ändringen, som meddelades bara några timmar före avbrottet, lämnade utvecklare i panik när botar, CI/CD‑assistenter och datapipeline‑verktyg förlorade åtkomsten till Anthropics Claude‑modeller. Användare av OpenClaw rapporterade felmeddelanden på sina instrumentpaneler, medan flera SaaS‑leverantörer varnade sina kunder att schemalagda jobb skulle misslyckas tills nya uppgifter kunde utfärdas. Avstängningen är betydelsefull eftersom den blottlägger en strukturell sårbarhet i den framväxande ekosystemet av agentbaserade AI‑tjänster. MCP introducerades i slutet av 2024 som ett universellt “USB‑C” för LLM:er, med löftet om plug‑and‑play‑anslutning mellan modeller och externa verktyg. Anthropics ensidiga förändring – i praktiken ett plötsligt borttagande – visar hur en leverantör kan ändra behörigheter eller byta verktygsdefinitioner efter att användarna redan gett sitt samtycke, ett scenario som beskrivs i ny forskning från ETDI om verktygs‑squatting och plötsliga borttagningar. För företag som har integrerat LLM‑driven automation i kritiska arbetsflöden innebär sådana överraskande återkallelser driftstopp, risk för dataexfiltrering (om skadliga ersättningar införs) och juridisk exponering på grund av brutna service‑nivåavtal. Vad som är viktigt att följa: Anthropic har lovat att införa en “grace‑period” för förnyelse av OAuth, men tidslinjen är fortfarande vag. Branschorganisationer håller redan på att utarbeta policy‑baserade åtkomstkontroller som skulle kräva att leverantörer meddelar brytande förändringar med minst 30‑dagars varsel. Regleringsmyndigheter i EU och Norge förväntas granska om sådana ensidiga avslut strider mot de framväxande AI‑tjänstetransparensreglerna. Utvecklare bör granska sina MCP‑beroenden, implementera reserv‑autentiseringsvägar och följa den kommande OWASP MCP Security Cheat Sheet för härdningsriktlinjer. Händelsen är en tydlig påminnelse om att beroendet av en enda LLM‑leverantör kan bli en ensam felpunkt i AI‑först‑arkitekturer.
36

Gemma-4 har problem med distributionen, easyaligner för ljud och Claude Enterprise:s integritetspolicy

Dev.to +6 källor dev.to
claudedeepmindgemmagooglemultimodalprivacy
Googles senaste öppen källkodsmodell, Gemma-4, har stött på problem ute på fältet. Tidiga användare i hela Europa rapporterar att den utlovade "frontier multimodal intelligens på enheten" hackar på standardhårdvara, med minnesavtryck och fördröjning som överstiger modellens specifikationer. Problemet verkar vara kopplat till modellens utökade ljudgren, som till skillnad från dess mindre syskon kräver en dedikerad DSP-pipeline som många edge-AI-kit saknar. För nordiska startups som har satsat på Gemma-4 för att driva nästa generations assistenter och vision-plus-tal-agenter tvingar bakslaget till en omprövning av distributionsplanerna och kan återuppliva intresset för mer mogna alternativ som LLaMA-3 eller Anthropics Claude. Samtidigt har den öppna källkods-gemenskapen introducerat "easyaligner", ett lätt Python-bibliotek som synkroniserar rått ljud med texttranskriptioner i nära realtid. Byggt på Whisper-encoder och med dynamisk tidssammanvävning hävdar verktyget en under-50 ms justeringsfel på 16 kHz-tal, en prestandaförbättring som kan mildra några av Gemma-4:s ljudintegreringsproblem. Tidiga benchmark-tester visar att det fungerar utan problem med både Whisper och de mindre Gemma-4-ljudhuvudena, och erbjuder utvecklare en pragmatisk bro samtidigt som den större modellen mognar. Den tredje tråden återbesöker Claude Enterprises integritetspolicy. Följande vår täckning av dold telemetri i Claude Desktop och system-prompt-skiftet mellan version 4.6 och 4.7, avslöjar nya interna dokument som läckt från Anthropic att företagsnivån fortsätter att logga finmaskig användningsmetadata - inklusive promptinnehåll och modellgenererad kod - till en central analysnav. Anthropic hävdar att data är anonymiserad och används för att förbättra säkerheten, men avslöjandet återupptar debatten om företags AI-ansvar, särskilt för reglerade sektorer i Norden. Vad som kommer att hända härnäst: Google förväntas släppa en patchad Gemma-4-variant med en smalare ljudstack inom några veckor; easyaligners underhållare planerar en Rust-baserad backend för att ytterligare minska fördröjningen; och Anthropic har lovat en oberoende granskning av Claude Enterprises datahantering, med resultat som förväntas senast i slutet av Q3. Sammanflödet av modell-distributionsutmaningar, verktygsinnovation och integritetsgranskning kommer att forma regionens AI-antagandekurva under de kommande månaderna.
35

EU tilldelar 180 miljoner euro för suverän molntjänst till fyra leverantörer

Mastodon +6 källor mastodon
Europeiska kommissionen har undertecknat ett sexårigt avtal på 180 miljoner euro med fyra europeiska molnkonsortier för att leverera ”suverän moln”-tjänster till EU:s institutioner, organ, kontor och byråer. Tilldelningen, som offentliggjordes på fredagen, avslutar en upphandlingsprocess som inleddes i oktober 2025 och markerar blockets mest ambitiösa satsning för att minska beroendet av icke‑europeiska leverantörer. De vinnande konsortierna är Post Telecom – i samarbete med CleverCloud och OVHcloud – StackIT, Scaleway och Proximus, som kommer att leverera tjänster via sitt joint venture S3NS med Thales och Google Cloud. Tillsammans ska de erbjuda infrastruktur som uppfyller EU:s dataskyddsregler, EU:s egna säkerhetsstandarder samt de värderingar som fastställs i Digital Services Act och kommande AI‑regleringar. Avtalet är viktigt eftersom det skapar ett dedikerat, juridiskt förenligt molnlager för den offentliga sektorn, vilket skyddar känslig data från utländsk jurisdiktion och potentiell leveranskedjelåsning. Genom att sprida arbetsbelastningen över flera leverantörer syftar kommissionen till att öka motståndskraften, stimulera konkurrens bland europeiska teknikföretag och lägga grunden för AI‑drivna arbetsbelastningar såsom generativ AI, MLOps och storskalig dataanalys. Avtalet samspelar också med Digital Europe‑programmet, som avsätter miljarder för att bygga ett inhemskt digitalt ekosystem. Kommande steg kommer att fokusera på utrullningsplanen, servicenivåavtal och integrationen av AI‑verktyg som uppfyller EU:s kommande
35

Nya väggar för din skärm: "River Sunrise" anländer till Daily Wallpaper

Mastodon +6 källor mastodon
openai
Daily Wallpaper-appen för iOS och macOS har lagt till en fräsch, AI-skapad bakgrundsbild med titeln "River Sunrise", som nu finns tillgänglig via deras App Store-listing (dailywallpaperapp.com/appstore). Bilden, en levande skildring av tidig morgonljus som sprider sig över en flod, genererades med OpenAIs senaste diffusionsmodell och är märkt under AForest-projektet, ett samarbetsprojekt som kombinerar generativ AI-forskning med naturinspirerad estetik. Utgivningen markerar den tredje AI-drivna bakgrundsbild som tjänsten har släppt den här månaden, efter MissKittyArt-serien som vi rapporterade om den 4 april om generativ AI-installationer. Genom att leverera en ny högupplöst bild varje dag, förvandlar Daily Wallpaper telefonen och skrivbordets startsida till en roterande galleri, och undviker de statiska, royaltyfria paket som har dominerat marknaden i år. Draget understryker en bredare förändring: AI-verktyg är inte längre begränsade till professionella studior, utan införlivas direkt i konsumentinriktade appar, vilket ger användarna omedelbar tillgång till anpassad konst utan att behöva designfärdigheter eller dyra program. Utöver nyheten väcker utgivningen frågor om upphovsrätt, kommersialisering och urval. OpenAIs licensvillkor tillåter kommersiell användning av genererade bilder, men appens affärsmodell - gratis nedladdning med valfria premium-prenumerationer för högupplösta filer - antyder en test av konsumenternas villighet att betala för AI-kuraterad estetik. Dessutom antyder AForest-märkningen en tematisk serie som kan utvecklas till ett varumärkesekosystem, som potentiellt kan locka annonsörer som söker naturanpassade visuella placeringar. Vad som kommer härnäst: Daily Wallpaper planerar att introducera användarstyrda prompter senare i kvartalet, vilket låter prenumeranter styra AI-stilen i realtid. Konkurrenter som Walli och Artify experimenterar redan med liknande funktioner, så de närmaste månaderna kommer troligen att se en snabb eskalering av AI-drivna personanpassningsverktyg. Håll ett öga på hur Apples kommande iOS 18-widgetar integrerar dynamiska bakgrunder, en utveckling som kan förvandla daglig AI-konst från en nyhet till en kärndel av den mobila upplevelsen.
35

💻 Unlearn‑Saliency: AI‑etik och modellviktar förenas starkare än människor

Mastodon +6 källor mastodon
ethics
Ett forskarlag presenterade **SalUn**, en teknik som låter neuronät radera specifika träningsexempel genom att bara justera de mest inflytelserika vikterna. Tekniken presenterades som en ICLR 2024 Spotlight‑artikel, där SalUn identifierar “framträdande” parametrar kopplade till ett mål‑data och uppdaterar dem tillräckligt för att eliminera exempelets avtryck utan att påverka resten av modellen. På CIFAR‑10‑benchmarken nådde metoden en glömningsnoggrannhet med ett avstånd på endast 0,2 % från en full återträningsbaslinje, ett resultat som motsvarar beräkningskostnaden för en enda epok. Genombrottet är viktigt eftersom rätten att bli glömd och växande dataskyddsregler tvingar organisationer att radera personuppgifter från allt större modeller. Traditionella metoder – att återträna från grunden eller finjustera på återstående data – är ekonomiskt oöverkomliga för dagens system med flera miljarder parametrar. Genom att arbeta på viktnivå erbjuder SalUn en skalbar, lågkostnadslösning för efterlevnad, vilket potentiellt kan förändra hur företag hanterar modellens livscykel och granskar datakällor. Utöver efterlevnad berör arbetet en djupare etisk debatt om modellens ogenomskinlighet. Förklaringar baserade på saliens har länge kritiserats för sin instabilitet; SalUn vänder på steken genom att använda samma känslighet för att lokalisera exakt vilka parametrar som kodar en datapunkt. Den dubbla användningen av saliens väcker därför en ny säkerhetsfråga: kan angripare utnyttja selektiv viktsmodifiering för att medvetet försämra en modell, som nyliga undersökningar av federerad glömning har varnat för? Nästa steg blir att testa SalUn på större bild‑ och språkmodeller samt på verkliga begäran om dataradering under GDPR‑liknande ramverk. Forskare förväntas också utforska sky
35

iPhone 18 Pro kan få fyra färger

Mastodon +6 källor mastodon
apple
Apple ska enligt uppgift begränsa färgpaletten för den kommande iPhone 18 Pro till fyra nyanser, enligt ett Bloomberg‑tips och bekräftande rapporter från MacRumors och Instant Digital. Sortimentet förväntas omfatta en mörk vinröd, en dämpad kaffebrun, en rik lila och en fjärde nyans som verkar vara en modern tolkning av roséguld, en färg som Apple senast erbjöd på iPhone 16 Pro. Ryktena, som samlats sedan november, tyder på att de nya färgerna kommer ersätta de traditionella silver-, grafit- och guldalternativen som har präglat de senaste Pro‑modellerna. Färdvalet är viktigt eftersom Apples premiumprodukter i allt högre grad förlitar sig på visuell differentiering för att motivera högre priser och hålla produktcykeln fräsch. En begränsad men distinkt palett kan driva efterfrågan bland tidiga köpare, stimulera försäljning av tillbehör och stärka varumärkets ”fashion‑tech”-positionering gentemot Android‑flaggskepp som ofta framhäver ett bredare spektrum av ytbehandlingar. Dessutom stämmer valet av mörkare, dämpade toner överens med en bredare branschtrend mot återhållsam estetik, medan den möjliga återinföringen av roséguld antyder en nostalgisk nick till tidigare konsumentfavoriter. Det som
35

Artemis II-kommendören delar en häpnadsväckande video av jorden som försvinner bakom månen

Mastodon +6 källor mastodon
apple
NASA:s Artemis II-kommendör Reid Wiseman har publicerat en kort klipp som fångar jorden som glider bakom månens ojämna horisont under färden på månens bortre sida den 6 april. Filmen, som är inspelad med hans iPhone 17 Pro Max från Orion-kapseln, visar den blå planeten som långsamt försvinner, följt av en omvänd "jorduppgång" när rymdfarkosten kommer fram på den motsatta sidan av månens kant. Videon spreds snabbt som en löpeld och erbjuder en synvinkel som bara ett fåtal astronauter någonsin har upplevt. Bilden är mer än bara en socialmediamoment. Artemis II markerar den första bemannade månresan sedan Apollo 17, och färden på månens bortre sida ger kritisk data för navigation, kommunikation och den kommande Artemis III-landningen. Genom att dokumentera jord-månegeometrin i realtid hjälper Wisemans video ingenjörer att validera banmodeller och förbättra timingen av rymdfarkostens motorbränningar. Allmänhetens reaktion understryker också uppdragets värde för utåtriktad verksamhet: levande, personliga bilder kan upprätthålla politiskt och ekonomiskt stöd för Artemisprogrammet i Europa och Norden, där investeringar i rymdteknologi ökar. I framtiden kommer besättningens nästa milstolpar att följas noga. Artemis II kommer att slutföra en tiodagars resa, som kulminerar i en vattentäckning senare denna månad, varefter NASA planerar att släppa ytterligare ombordvideo, inklusive en solförmörkelse som observerats från månbanan. Dataströmmen kommer att mata in i AI-drivna analysverktyg som förbättrar bildupplösningen och extraherar vetenskapliga mätningar, en utveckling som kan påskynda planeringen för Artemis III:s historiska ytmålning 2027. När uppdraget fortskrider kommer analytiker att övervaka hur det visuella innehållet påverkar allmänhetens inställning och beslut om finansiering för den bredare månutforskningsagendan.
35

iOS 26.4.2‑uppdatering för iPhone kommer snart

Mastodon +6 källor mastodon
apple
Apple testar iOS 26.4.2 internt, och bygget förväntas rullas ut till iPhone‑användare inom några veckor, enligt besöksloggdata som rapporterats av 9to5Mac. Den nya punktuppdateringen följer 26.4.1‑utgåvan som kom den 19 april och automatiskt aktiverade en sekretessfokuserad säkerhetsfunktion för alla enheter. Tidiga indikationer tyder på att 26.4.2 kommer att åtgärda den svart‑vita notifikationsbuggen som uppstod efter 26.4.1, samt ett antal stabilitetsproblem som flaggats av utvecklare på GitKraken och andra verktygsplattformar. Tidpunkten är viktig eftersom Apples punktutgåvor har blivit en de‑facto‑kanal för snabba buggfixar och inkrementella AI‑förbättringar. iOS 26 introducerade en svit av på‑enheten stora språkmodeller (LLM)‑funktioner, och 26.4‑serien har redan sett förfiningar av röstassistenter och förutsägande text. Genom att snabbt trycka ut 26.4.2 signalerar Apple att de finjusterar dessa funktioner samtidigt som de stärker säkerheten inför den kommande iOS 27‑förhandsvisning som antyddes på WWDC 2026. För nordiska företag som är beroende av iPhone‑säkerhet och AI‑drivna arbetsflöden kan uppdateringen återställa full funktionalitet för kritiska appar som stannade efter 26.4.1. Det som är att hålla utkik efter härnäst är den officiella versionsnoteringen när Apple öppnar den offentliga betaversionen. Analytiker kommer att leta efter eventuella omnämnanden av nya LLM‑relaterade API:er, utökade sekretesskontroller eller kompatibilitetjusteringar för de senaste iPadOS 26.5‑ och macOS 15‑utgåvorna. Utvecklare bör också bevaka App Store Connect‑portalen för eventuella obligatoriska SDK‑uppdateringar som kan följa med uppdateringen. Om utrullningen går smidigt kommer Apple sannolikt att utnyttja momentumet för att främja sin bredare AI‑färdplan inför iOS 27‑lanseringen senare i år.
35

Stora språkmodeller och generativ AI, herregud! | Framsteg inom arkeologisk praxis | Cambridge Core

Mastodon +6 källor mastodon
Peter Cobbs nya uppsats, “Stora språkmodeller och generativ AI, herregud!”, publiceras i Cambridge Cores Advances in Archaeological Practice Volym 11, Specialnummer 3, och kartlägger den snabba infiltreringen av verktyg som ChatGPT, Midjourney och framväxande multimodala modeller i arkeologisk forskning. Cobb hävdar att generativ AI redan omformar dokumentationen av fältarbete, klassificeringen av artefakter och utformningen av utgrävningsrapporter, samtidigt som den blottlägger en rad etiska dilemman som disciplinen ännu inte har löst. Texten katalogiserar konkreta experiment: LLM‑styrd transkription av epigrafiska korpora, bild‑till‑text‑kedjor som föreslår typologier för keramikskärvor, och automatiserad berättargenerering som kan omvandla råa fält
33

Regulatorer granskar Anthropic:s Mythos för banksystemrisker

HN +6 källor hn
anthropic
Regulatorer skärper granskningen av Anthropics senaste storskaliga språkmodell, Mythos, efter att banker på andra sidan Atlanten börjat använda den för att upptäcka dolda cyberhot. Financial Stability Board (FSB) har tillkännagivit en samordnad granskning av modellens systemiska konsekvenser och lovat att föra resultaten till centralbanker och tillsynsmyndigheter världen över. Initiativet följer en våg av pilotprojekt på Wall Street där stora institutioner rapporterar att Mythos redan har avslöjat tusentals noll‑dagssårbarheter i gammaldags bankplattformar. Den ökade uppmärksamheten speglar en växande oro för att samma förmåga som driver Mythos hotdetektering också kan missbrukas av illvilliga aktörer. Tyska banktillsynsmyndigheter har varnat för att modellens djupgående kodanalysfunktioner blottlägger strukturella svagheter i föråldrade kärnbankssystem, medan seniora tjänstemän vid Bank of England har inlett en formell undersökning av huruvida Mythos kan destabilisera den finansiella marknadsinfrastrukturen. Goldman Sachs’ chef för riskhantering beskrev i ett privat samtal modellen som “mycket medveten” om systemrisk, och uppmanade till en försiktig utrullning. Varför detta är viktigt nu är tvåfaldigt. För det första är banksystemet den mest reglerade och sammanlänkade delen av den globala ekonomin; ett intrång förstärkt av en AI som kan avslöja dolda brister kan sprida sig över marknaderna. För det andra signalerar det regulatoriska svaret ett skifte från ad hoc‑riskbedömningar till ett samordnat, gränsöverskridande styrningsramverk för banbrytande AI, vilket påminner om tidigare farhågor som lyftes i vår rapport den 19 april om finansministrarnas oro över Mythos. Vad som är att hålla ögonen på härnäst: FSB:s kommande rapport, som förväntas inom de närmaste veckorna, kommer sannolikt att forma vägledningen för AI‑drivna cybersäkerhetsstandarder. Samtidigt kan Bank of England:s utredning leda till obligatoriska rapporteringskrav för AI‑assisterad sårbarhetsskanning. Slutligen kommer branschobservatörer att följa om banker skalar upp Mythos bortom pilotfaser eller drar sig tillbaka till mer kontrollerbara, mindre ogenomskinliga verktyg. Resultatet kommer att skapa ett prejudikat för hur finansvärlden balanserar AI‑drivna säkerhetsvinster mot spöket av ny systemrisk.
32

MTA:s nya simulerings-teknik ska snart utbilda nya bussförare

Mastodon +6 källor mastodon
googleopenai
Metropolitan Transportation Authority har beställt en AI-förstärkt buss-simulator för 1,4 miljoner dollar, som snart kommer att ersätta större delen av den väg-baserade utbildningen för nya förare. Installerad vid Zerega-utbildningscentret i Bronx, projicerar systemet realistiska trafik-, väder- och passagerar-scenarier på en fullskalig virtuell kopia av Manhattans gator. Eleverna kan öva på filbyten, stoppskylts-efterlevnad och nödbromsning utan att utsätta resenärer för fara eller slitage på fordonsparken. Beslutet kommer mitt i en kronisk förarbrist och en rad säkerhetsincidenter som har pressat MTA att modernisera sin introduktionsprocess. Genom att lära ut färdigheter i en kontrollerad digital miljö förväntar sig myndigheten att kunna minska tiden till certifiering med upp till 30 procent och reducera olyckor i början av karriären, enligt tjänstemän. Simulatorns AI-kärna, byggd på modeller från OpenAI och Google AI, genererar dynamiska trafikmönster som anpassar sig till en förares beslut, och erbjuder en nivå av variation som statiska video-baserade kurser inte kan matcha. Branschobservatörer noterar att tekniken speglar vad flygbolag har använt i decennier och vad företag som utvecklar autonoma fordon testar idag. Om pilotprojektet visar sig vara framgångsrikt planerar MTA att införa systemet på sina andra depåer och att integrera realtids-tjänstedata, vilket gör det möjligt för eleverna att öva på störningar som byggnadsomledningar eller svåra väderhändelser. Myndigheten antydde också en framtida "digital tvilling" av hela bussnätverket, där AI kan simulera fordonsparkens prestanda under olika politiska scenarier. Håll utkik efter den första kullen av studenter som utexamineras från simulatorn senare i år, och MTA:s rapport efter införandet, planerad till början av 2027, som kommer att avslöja kostnadsbesparingar, säkerhetspåverkan och om andra kollektivtrafikmyndigheter kommer att anta liknande AI-drivna utbildningsplattformar.
32

Attackytan ökar exponentiellt

Mastodon +6 källor mastodon
agents
EN NY RAPPORT som släppts den här veckan av säkerhetsanalytikern Chris Hughes varnar för att den snabba expansionen av offentligt tillgänglig kod skapar en “attack‑surface exponential” som ingen organisation är förberedd på att försvara. Rapporten, med titeln *Code Surge: GitHub’s Exponential Growth and the Attack Surface Nobody Is Ready For*, kartlägger en tio‑faldig ökning av antalet lagringsplatser på GitHub sedan 2022 – en uppgång som drivs av AI‑assisterade kodgeneratorer och demokratiseringen av verktyg för mjukvaruutveckling. Studien menar att varje rad av automatiskt genererad kod, varje mikrotjänst‑API och varje IoT‑firmware‑uppdatering ger en ny fotfäste för hotaktörer. Hughes pekar på “Vulnpocalypse” – ett begrepp som myntats för den oundvikliga vågen av sårbarheter som kommer att dyka upp när AI‑agenter producerar kod snabbare än säkerhetsteam kan granska den. Rapporten hänvisar till nyliga incidenter, såsom den skadliga falska Claude‑webbplatsen och den heta debatten kring OpenAIs ledarskap, som tidiga tecken på att angripare redan utnyttjar den växande kodbasen. Varför det är viktigt nu är enkelt: traditionella perimeterförsvar tappar relevans i en värld där själva perimetern sprider sig över molnfunktioner, containeriserade tjänster och miljarder anslutna enheter. Branschanalytiker som presenterades i en LinkedIn‑briefing betonade att företag som i slutet av 2026 ännu inte har övergått till fullt automatiserad, API‑först attack‑surface management (ASM) kommer att stå inför en oproportionerligt hög risk för intrång. Plattformar för extern attack‑surface‑övervakning positioneras som nödvändiga för “perimeter‑less” hotdetektering, medan API‑säkerhetsramverk kämpar för att hålla jämna steg med den mångfald av slutpunkter som uppstår. Det som bör bevakas härnäst är tre samverkande trender. För det första förväntas leverantörer av automatiserade ASM‑verktyg inom några månader lansera AI‑drivna triage‑funktioner. För det andra håller regulatorer i EU och de nordiska länderna på att utarbeta riktlinjer som kan kräva kontinuerlig exponering‑övervakning för kritisk infrastruktur. För det tredje är en våg av högprofilerade exploateringar mot AI‑genererade bibliotek sannolik att sätta branschens beredskap på prov innan årets slut. Företag som integrerar kontinuerliga kod‑audit‑pipelines och investerar i real‑time‑övervakning av attackytan kommer att vara de som lyckas hålla sig steget före den annalkande “Vulnpocalypse”.
32

Det är lustigt att se folk vrida sig till pretzels för att förutse en framtida etisk användning av en #LLM,

Mastodon +6 källor mastodon
Ett performancekonstverk på Nordiska AI‑etiktopmötet i Helsingfors förra veckan väckte både blickar och tidslinjer. Under en panel om “Ansvarsfull implementering av stora språkmodeller” knöt flera talare och inbjudna aktivister sig i pretzel‑liknande former medan de debatterade hur LLM‑modeller kan användas etiskt. Den visuella gaggen, som sändes live och undertexterades med hashtaggen #LLM, var avsedd att dramatisera den “vridning” av policy, forskning och marknadskrafter som krävs för att hålla kraftfulla språkmodeller i schack. Stuntet blev snabbt en uppmärksamhetspunkt på sociala medier. Kritiker menade att spektaklet maskerar ett djupare problem: utan att konfrontera den vinstdrivna logiken i kapitalismen blir varje etisk ram för LLM‑modeller ytlig. En kommentator skrev: “Folk vrider sig till pretzels för att förutse en framtida etisk användning av en LLM, men glömmer att det inte finns någon etisk konsumtion under kapitalismen.” Kommentaren fick genomslag i de nordiska teknikkretsarna och återuppväckte en debatt som har kokat sedan tidigare rapportering om AI‑styrning i regionen. Varför upproret är viktigt är tvådelat. För det första belyser det en växande klyfta mellan teknologer som förespråkar inkrementella skyddsåtgärder – såsom de utvärderingsdrivna pipelines som beskrivs i våra senaste artiklar om lokala LLM‑agenter – och aktivister som kräver systemisk förändring av de ekonomiska strukturer som finansierar och tjänar på AI. För det andra tvingar det virala ögonblicket beslutsfattare att ta hänsyn till allmänhetens uppfattning: etisk AI är inte längre en nischad akademisk fråga utan en kulturell brännpunkt som kan forma lagstiftning. Det som bör hållas ögonen på härnäst är de konkreta resultaten av toppmötet. Finlands näringsministerium har lovat ett vitt papper om AI‑ansvar inom tre månader, och EU‑kommissionens revidering av AI‑förordningen är planerad till en hörning i juni där nordiska representanter kommer att driva på för starkare marknadsnivååtaganden. Samtidigt har pretzel‑prestationen startat en serie “etisk‑AI” hackathons
32

vitrupo (@vitrupo) på X

Mastodon +6 källor mastodon
Max Levchin, medgrundare av PayPal och fintech‑entreprenör, väckte ny debatt på X när han idag beskrev dagens mjukvaruingenjörer som ”mjukvaruskulptörer” snarare än traditionella kodare. I en retweet som delades av AI‑kommentatorn vitrupo, hävdade Levchin att framväxten av stora språkmodeller (LLM) har förflyttat ingenjörens roll från att skriva kod för hand till att styra konversationsagenter som genererar, förfinar och felsöker mjukvara på begäran. Observationen kommer i ett avgörande ögonblick för branschen. Verktyg som GitHub Copilot, OpenAIs ChatGPT och Anthropics Claude producerar nu funktionella kodsnuttar, hela funktioner eller till och med mikrotjänster efter några naturliga språk‑promptar. Företag rapporterar upp till 30 % produktivitetsökning, och riskkapital strömmar in i startups som integrerar LLM direkt i utvecklingspipeline‑erna. Ändå understryker Levchins poäng ett kvarstående mänskligt element: smak, arkitektonisk bedömning och etisk framsynthet kan inte automatiseras fullt ut. Ingenjörer måste lära sig att formulera problem, kritiskt granska modellens output och injicera domänspecifik nyans – färdigheter som blir allt mer värdefulla jämfört med ren syntax‑kunskap. Det som bör hållas ögonen på härnäst är framväxten av en ny yrkesnisch. Prompt‑engineering och ”modell‑centrerad” design dyker redan upp i jobbannonser, medan stora IDE‑leverantörer rullar ut integrerade chattgränssnitt och real‑tids kodgransknings‑botar. Universitet reviderar sina läroplaner för att kombinera mjukvarugrunder med prompt‑skapande och modell‑tolkning. Samtidigt kämpar företag med styrning – hur man granskar AI‑genererad kod för säkerhetsbrister, licensöverträdelser och bias. Om Levchins ”mjukvaruskulptör”‑tes håller, kommer nästa produktivitetsvåg att bero på hur snabbt utvecklare kan bemästra dialogen med LLM samtidigt som de bevarar den kritiska mänskliga bedömningen som håller mjukvara pålitlig, säker och i linje med affärsmål. Balansen mellan automatisering och tillsyn kommer forma framtiden för mjukvaruutveckling i Norden och bortom.
32

Mal (@unbankedgroup) på X

Mastodon +6 källor mastodon
agentsclaude
Mal, utvecklaren bakom Unbanked AI‑verktygscommunityn, publicerade ett kort utvecklingstips på X som redan får genomslag bland byggare av Claude‑baserade agenter. Inlägget förklarar att en ”verktygsbeskrivningsfil” – ofta benämnd CLAUDE.md – fyller samma funktion som en systemprompt, och att utvecklare får bättre resultat genom att skriva en tydlig, uppgiftsorienterad brief för agenten i stället för att iterativt justera systemprompten. Rådet, märkt med #promptengineering, #aiagents, #tooling och #llm, understryker en växande konsensus att explicita, strukturerade instruktioner slår den trial‑and‑error‑metod som dominerade den tidiga LLM‑experimenteringen. Tipset kommer i samma vecka som de kinesiska teknikjättarna Alibaba, Baidu och Tencent alla lanserat AI‑agentplattformar för företag, där Alibaba rapporterade 20 miljoner företagsanvändare i samband med sin DingTalk‑lansering. Dessa utrullningar belyser ett marknadsskifte: företag går från generiska chatbots till skräddarsydda agenter som utför definierade arbetsflöden. Genom att förespråka verktygsbeskrivningsfiler driver Mal utvecklargemenskapen mot en mer disciplinerad ingenjörspraxis som kan skalas över så stora implementationer. Varför det är viktigt är tvådelat. För det första minskar tydligare uppgiftspecifikationer den ”prompt‑trötthet” som bromsar utvecklingscykler och kan introducera dolda bias eller säkerhetsluckor – problem som nyligen har dykt upp i Claude‑relaterade malware‑incidenter. För det andra banar ett standardiserat beskrivningsformat vägen för interoperabla överlämningsprotokoll, ett koncept som Mal tidigare demonstrerat med ett strukturerat ”handoff”‑schema som låter flera agenter överlämna arbete sömlöst. Framöver kommer utvecklare att hålla ögonen på Anthropics svar: om de formaliserar CLAUDE.md‑liknande filer i sitt SDK eller verktygssvit. Samtidigt kan det konkurrenstryck som Alibaba, Baidu och Tencent utövar påskynda antagandet av sådana standarder i hela LLM‑ekosystemet, och forma hur företag bygger pålitliga, underhållbara AI‑agenter.
30

Från noll till AI‑agenthjälte: min sex‑månaders resa av försök och misstag

Dev.to +6 källor dev.to
agents
En utvecklare som i ett halvår har experimenterat med stora språkmodell‑agenter släppte det öppna källkods‑ramverket “AgentZero” på GitHub och meddelade i ett uppriktigt blogginlägg med titeln “From Zero to AI Agent Hero” att resan på sex månader av försök och misstag nu nått sitt slut. Inlägget guidar läsarna genom de felsteg som plågade de tidiga prototyperna – felaktigt konfigurerade verktygsbehörigheter, ostabila kontextfönster och dyra enbart‑moln‑distributioner – samt de praktiska lösningarna som slutligen gav en lokalt körbar agent som kan surfa, programmera och automatisera rutinuppgifter utan att avslöja AWS‑uppgifter. AgentZero:s attraktionskraft ligger i dess “lokal‑först”-design, som återkallar den multi‑agent‑instrumentpanel vi rapporterade tidigare i månaden, samt dess själv‑onboarding‑BaaS‑lager som låter nya agenter registrera egna verktyg och behörigheter. Genom att paketera en lättviktig modul för kontextutformning låter ramverket utvecklare forma en agents “sinne” med promptmallar och minnesstrategier, ett koncept vi utforskade i vår artikel den 20 april om kontextutformning för agentbaserade system. Förrådet innehåller också en felsökningsguide som behandlar de “förbjudna” fel som många nybörjare stöter på när agenter försöker anropa externa API:er utan korrekta åtkomsttoken. Varför detta är viktigt är tvådelat. För det första sänker releasen tröskeln för hobbyister och små och medelstora företag att experimentera med autonoma agenter utan att ge upp kontrollen till molnleverantörer, vilket stärker övergången mot integritetsskyddande, lokalt placerad AI. För det andra erbjuder den öppna dokumentationen av fallgropar en sällsynt lärresurs som kan påskynda ekosystemets övergång från proof‑of‑concept‑demo till produktionsklara tjänster. Att hålla ögonen på nästa steg innebär att följa communityns respons på GitHub – ärenden, pull‑requests och plugin‑bidrag som kan utöka AgentZero:s verktygssats. Vi kommer också att bevaka om ramverket antas i kommande versioner av lokal‑först‑instrumentpaneler och om företag citerar det som ett säkert alternativ till molnbaserade agenter med tunga autentiseringskrav. De kommande veckorna bör avslöja om AgentZero blir en hörnsten i den framväxande själv‑hostade agent‑stacken.
30

Skugg‑

Dev.to +5 källor dev.to
En ny branschomfattande undersökning som släpptes den här veckan visar att ”Shadow AI” – den oauktoriserade användningen av stora språkmodeller (LLM) av anställda – är mycket mer utbredd än de flesta säkerhetsteam inser. Forskare kvantifierade klyftan mellan officiellt godkända AI‑verktyg och de dolda, anställdadrivna arbetsflöden som kanaliserar konfidentiell data till offentliga chattbotar såsom ChatGPT, Claude och Gemini. Studien fann att över sektorer är de vanligaste datatyperna som klistras in i dessa tjänster kundkommunikation, interna konfidentiella dokument, källkod, finansiella register och, i reglerade områden, skyddad hälsoinformation. Resultaten är viktiga eftersom varje kopiera‑och‑klistra‑handling utgör ett direkt brott mot företagets datastyrningspolicyer och i många jurisdiktioner ett brott mot integritetsregler såsom GDPR och EU‑AI‑lagen. När konfidentiellt material hamnar på externa servrar förlorar organisationer synlighet, riskerar modell‑injektionsattacker och utsätts för stöld av immateriella rättigheter. Rapporten visar också att företag som öppet uppmuntrar experimentering samtidigt som de tillhandahåller granskade, interna LLM‑plattformar upplever betydligt mindre Shadow AI – inte för att anställda använder AI mindre, utan för att deras aktivitet är synlig och styrd. Det som bör hållas ögonen på härnäst är de framväxande styrningssvaren. Flera leverantörer lanserar ”AI‑observability”‑paket som övervakar utgående trafik för LLM‑promptar, medan Europeiska kommissionen utarbetar obligatoriska AI‑riskbedömningsklausuler för stora företag. I Norden kommer det kommande AI‑Governance Forum i Köpenhamn att ha en panel om att integrera skugg‑AI‑detektering i befintliga säkerhetsoperationer. Förvänta er strängare företagspolicyer, mer robusta interna modellutbud och en våg av efterlevnadsrevisioner som syftar till att dämpa den dolda vågen av generativ‑AI‑användning innan den urholkar de datatillgångar som företagen är beroende av.
26

Mark Gadala-Maria (@markgadala) på X

Mastodon +6 källor mastodon
anthropicclaude
Claude Design, Anthropics generativa AI‑designsvit, omformar redan arbetsflödet för kreativa redan två dagar efter den offentliga lanseringen. I ett X‑inlägg den 20 april pekade AI‑kommentatorn Mark Gadala‑Maria på tio slående användningsfall som har dykt upp inom 48 timmar, allt från animerade sociala‑medieklipp till snabba varumärkes‑mock‑ups. Han menar att verktygets hastighet och användarvänlighet påskyndar spridningen av AI‑driven design både i byråer och interna team. Buzzet följer Anthropics lansering den 18 april, där Claude Opus 4.7 kombinerades med en samling design‑specifika promptar och en visuell redigerare. Tidiga användare berömde systemets förmåga att generera layout‑variationer, färgpaletter och rörelsegrafik enbart från vanlig text, vilket minskar itereringscykler från timmar till minuter. Gadala‑Marias katalog av exempel understryker hur plattformen går från statiska mock‑ups till fullfjädrade animationer – en funktion som tidigare krävde specialiserad mjukvara och skickliga animatörer. Varför det är viktigt är tvådelat. För det första signalerar den snabba antagandet ett brytpunkt för generativa AI‑verktyg på designmarknaden och utmanar etablerade aktörer som Adobe Creative Cloud och Figma, som först nyligen introducerat AI‑assistenter. För det andra kan demokratiseringen av högkvalitativt visuellt innehåll omforma marknadsföringsbudgetar, så att mindre företag kan producera kampanjmaterial på nivå med stora aktörer utan stora kreativa team, samtidigt som det väcker frågor om den framtida rollen för mänskliga formgivare. Att hålla ögonen på framöver inkluderar Anthropics prisstrategi och företagslicensplaner, vilka kommer att avgöra hur snabbt större varumärken tar i bruk tekniken. Konkurrenter förväntas påskynda sina egna AI‑designerbjudanden, och analytiker kommer att följa användningsstatistik från den kommande LongCoT‑benchmarksviten för att mäta prestanda på komplexa, flerstegs kreativa uppgifter. Användarfeedback kring upphovsrätt och attribution kommer också att komma fram i takt med att verktyget skalar, vilket potentiellt kan leda till nya branschstandarder för AI‑genererad visuell media.
26

Lloyd Creates (@lloydcreates) på X

Mastodon +6 källor mastodon
midjourney
Lloyd Creates, en visuell konstnär med en växande följarskara på X, publicerade ett slående exempel på generativ AI inom modedesign: med hjälp av QuiverAI omtolkade han en ikonisk sneaker till ett LEGO‑inspirerat minimalistiskt affischmotiv. Förvandlingen, som delades den 20 april, visar AI‑modellens förmåga att återge komplex produktbildning i förenklade, blockbaserade grafik samtidigt som varumärkets igenkänning bevaras. Lloyds arbetsflöde bestod av att mata in ett högupplöst fotografi av skon i QuiverAIs “style‑transfer”-pipeline, välja en LEGO‑inspirerad färgpalett och instruera systemet att producera en platt affisch som är lämplig både för digital marknadsföring och begränsad upplaga av merchandise. Demonstrationen är betydelsefull eftersom den signalerar ett skifte från AI‑genererad novellkonst till praktiska, varumärkescentrerade tillämpningar. Designers kan nu skapa flera visuella koncept på några minuter, vilket kraftigt minskar den iterativa fas som traditionellt kräver veckor av skissande och rendering. För sneaker‑tillverkare och återförsäljare innebär möjligheten att omedelbart producera anpassningsbara, iögonfallande material nya kanaler för säsongsbetonade kampanjer, pop‑up‑butiker och sociala‑medie‑teasers utan att anlita externa studior. Dessutom utnyttjar LEGO‑estetiken ett nostalgiskt visuellt språk som resonnerar med yngre konsumenter, vilket tyder på att AI kan hjälpa varumärken att snabbare hoppa på kulturella trender än någonsin tidigare. Det som bör hållas ögonen på härnäst är hur snabbt andra modehus tar i bruk liknande pipelines. QuiverAI har antytt kommande funktioner såsom 3‑D‑modellgenerering och real‑tids‑AR‑förhandsvisningar, som potentiellt kan integreras direkt med e‑handelsplattformar. Branschobservatörer kommer också att följa den juridiska debatten kring AI‑genererade designer, särskilt när det gäller varumärkesskyddade silhuetter. Om tekniken skalar kan vi förvänta oss en våg av AI‑skapade lookbooks, begränsade tryck och till och med samarbetssamlingar där AI:n själv krediteras som med‑designer. De kommande månaderna kan därför avgöra om generativ AI går från experimentell showcase till en stapelvara i modedesignens verktygslåda.
26

Glaze‑projektet (inklusive Glaze, Nightshade, WebGlaze och andra) är ett forskningsinitiativ som utvecklar

Mastodon +6 källor mastodon
University of Chicago:s Glaze‑projekt meddelade på tisdagen en stor uppgradering av sin svit av anti‑scraping‑verktyg och lanserade Glaze 2.0, Nightshade 1.5 samt en offentlig beta av WebGlaze. De tre komponenterna samverkar för att göra konstverk osynliga för generativa‑AI‑modeller samtidigt som de förblir oförändrade för mänskliga ögon. Glaze 2.0 förfinar den ursprungliga algoritmen som beräknar de minsta pixel‑nivå‑perturbationerna som behövs för att ”förvirra” en modells feature‑extractor; Nightshade 1.5 lägger till ett nytt ”gift‑bild”-läge som medvetet snedvrider en AI:s interna representation, och förvandlar en fruktskål till ett kalejdoskop av nagellackflaskor för modellen. WebGlaze erbjuder ett webbläsarbaserat gränssnitt som låter konstnärer applicera skyddet utan ett högpresterande GPU. Uppdateringen sker i ett läge där motståndet från konstvärlden mot icke‑samtyckt AI‑träning intensifieras. Högt profilerade rättegångar mot Stability AI och Midjourney har belyst den juridiska gråzonen kring dataskrapning, och många skapare fruktar att en bild, så snart den har indexerats, kan återanvändas i all oändlighet. Genom att inbädda ett defensivt lager vid källan syftar Glaze‑projektet till att återställa maktbalansen till enskilda konstnärer och tvinga AI‑utvecklare att söka explicita licenser. Teamet avslöjade också att ett säkerhetspapper från juni 2025, skrivet av forskare i Zürich, exponerade en metod för att reverse‑engineera den ursprungliga Glaze, vilket har drivit den pågående härdningsinsatsen. Det som bör bevakas härnäst är tre fronter. För det första kommer antagningsgraden bland visuella konstkollektiv att visa om verktygen kan skala bortom tidiga laboratorier. För det andra kan reaktionerna från stora AI‑leverantörer – särskilt OpenAI, som nyligen lanserade ”GPT Rosaline” för livsvetenskaplig forskning – forma framtida licensförhandlingar. Slutligen håller regulatorer i EU och USA på att utarbeta regler för transparens i AI‑träning; Glaze‑projektets öppen‑källkods‑ansats kan bli en referenspunkt för efterlevnad. Om uppgraderingarna står emot framväxande attacker, kan de bli de facto‑standarden för att skydda kreativt arbete i den generativa AI‑åldern.
24

En lokal först multiagent-instrumentpanel för Codex CLI och Claude-kod

Dev.to +6 källor dev.to
agentsclaudecopilotopenai
En ny öppen källkods-instrumentpanel ger utvecklare möjlighet att köra Codex CLI och Claude-kod sida vid sida på sina egna maskiner, vilket omvandlar de två AI-kodningsagenterna till en samordnad, lokalt värd arbetsflöde. "Local-First Multi-Agent Dashboard" paketerar en Svelte-baserad skrivbordsgränssnitt med ett lätthanterligt orkestreringsskikt som startar varje agent som en separat underprocess, dirigerar prompter och visualiserar de kodförändringar som var och en föreslår. Den kräver en Copilot Pro+-prenumeration och OpenAI Codex-tillägget, men annars körs den helt offline, lagrar alla interaktionsloggar på användarens enhet. Verktyget anländer i en tid då utvecklare alltmer frustreras över den opacitet som AI-genererade redigeringar medför. Nya undersökningar av AI-assisterad terminalkodning visar att agenter ofta genomför ändringar utan tydlig attribuering, vilket gör felsökning och regelefterlevnad svåra. Genom att visa varje agents utdata i realtid låter instrumentpanelen ingenjörer pausa, redigera eller avvisa ett förslag innan det påverkar lagret, återställer en mänsklig säkerhetsventil som många molnbaserade tjänster saknar. Den kringgår också de sekretessproblem som betonades i vår täckning av Claude Desktops dolda telemetri den 20 april, och erbjuder ett transparent alternativ som håller koden och prompterna utanför företagsbrandväggar. Samhället har redan börjat förka repot för att lägga till stöd för ytterligare agenter som Cursor och Skyvern, och för att ansluta fjärrfunktionsbakändar för typesäkra klient-serverinteraktioner. Håll utkik efter prestandamätningar som jämför fördröjning och tokenanvändning mot de värdversioner, och för tidiga användarfeedback om hur instrumentpanelen fungerar i större kodbas. Om projektet får draghjälp kan det sätta en ny standard för lokalt kontrollerade, multiagent-utvecklingsmiljöer, vilket kan förmå molntjänsteleverantörer att omvärdera balansen mellan bekvämlighet och användarsuveränitet.
24

Världen läcker framtiden: Utnyttja evolution för framtidsförutsägelse‑agenter

ArXiv +6 källor arxiv
agents
En ny pre‑print på arXiv (2604.15719v1) presenterar “Harness Evolution”, ett ramverk som gör det möjligt för en språkmodell av fast storlek att generera pålitliga framtidsförutsägelse‑agenter utan att åter‑träna den underliggande modellen. Författarna föreslår att man fäster ett lättviktigt, evolverbart “harness” på en bas‑LLM; harnes­sen får endast tillgång till offentligt tillgänglig data och förfinar iterativt sin interna policy genom evolutionsalgoritmer. I praktiken kan systemet tilldelas uppgifter som att förutsäga utfall – exempelvis valresultat, marknadsförändringar eller cyber‑hot‑banor – samtidigt som kärnmodellen förblir orörd. Tillvägagångssättet är viktigt eftersom det kringgår de kostsamma och tidskrävande fin‑tunings‑pipelines som dominerar dagens AI‑utveckling. Genom att hålla basmodellen statisk kan organisationer snabbt sätta igång specialiserade förutsägare på begäran, uppdatera dem med färsk data och omedelbart återgå till tidigare versioner om en förutsägelse visar sig vara osäker. Denna smidighet är särskilt relevant för höginsatssituationer där beslut måste fattas innan svaret är känt, ett gap som framhävs i papirets abstrakt. Konceptet sammanfaller också med nyliga branschinitiativ: Trends XDR‑drivna “Artificial Future”-plattform marknadsför redan plug‑in‑agenter för hot‑förutsägelse, och en tidigare anställd på OpenAI har nyligen argumenterat för att AGI kan uppstå redan 2027, vilket understryker kapplöpningen att bygga pålitliga verktyg för framtidsinsikt. Som vi rapporterade om Nyx‑testet av harnes­sen för AI‑agenter tidigare i månaden, konvergerar gemenskapen snabbt mot modulära, testbara tillägg för stora modeller. Harness Evolution förflyttar idén från enbart utvärdering till produktionsklar förutsägelse. De nästa stegen att hålla ögonen på inkluderar benchmark‑släpp som jämför det evolutionära harnes­sen med traditionell fin‑tuning på standardiserade prognos‑sviter, open‑source‑implementationer som kan integreras i befintliga agent‑pipeline‑system, samt regulatorisk granskning i takt med att förutsägelse‑agenter börjar påverka politik och finansmarknader. Om de tidiga resultaten håller, kan en ny klass av “plug‑and‑play” framtids‑förutsägelse‑agenter snart bli en självklar del av både företags‑AI‑stackar och offentliga beslutsprocesser.
24

Claude Code omvänd ingenjörskonst: 98,4 % av kodbasen är ett operativt ramverk

Dev.to +6 källor dev.to
agentsclaude
Ett forskarteam vid University College London har publicerat en fullskalig omvänd ingenjörsrapport om Anthropics “Claude Code”, den körmiljö som driver företagets agentbaserade assistenter såsom Claude 3.5 Sonnet. Genom att av‑obfuskera ungefär 1 900 TypeScript‑filer – omkring 512 KB och 50 000 kodrader – fastställde analytikerna att endast 1,6 % av kodbasen implementerar modellens beslutslogik. De återstående 98,4 % utgör ett deterministiskt operativt ramverk som hanterar behörighetskontroller, verktygsdirigering, kontextkomprimering, felåterhämtning, sessions‑persistens och andra infrastrukturuppgifter. Upptäckten omformar hur utvecklare ser på Claudes arkitektur. Istället för att inbädda säkerhetskontroller och verktygsval‑logik i språkmodellen har Anthropic överfört dessa ansvarsområden till ett separat, starkt ingenjörskonstruerat lager. Denna separation gör modellens resonemang mer transparent samtidigt som Anthropic får
23

Idag skriver jag: jag är trollkarl; läsare — spöke (dualitet). 🤖 Bild skapad av AI #AI #IA

Mastodon +6 källor mastodon
En slående AI‑genererad illustration som delades på ett brasilianskt sociala‑medieflöde har gått viral och parar ihop en mantelklädd “feiticeiro” (trollkarl) med en genomskinlig “leitor‑fantasma” (spök‑läsare) för att visualisera temat dualitet. Bilden, märkt med #AI, #IA och #GenerativeAI, skapades med en nyutgiven öppen‑källkodsdiffusionsmodell som blandar textpromptar på portugisiska och engelska, vilket gör att konstnärer kan experimentera med kulturellt specifika arketyper utan att behöva proprietära verktyg. Inläggets bildtext, “Hoje escrevo: sou feiticeiro; leitor — fantasma (dualidades),” placerar konstverket som en metafor för skaparen delade identitet: en idé‑trollkarl och en åskådare av den resulterande berättelsen. Dess snabba spridning — över 150 000 gillningar och tusentals omformningar inom
23

AshutoshShrivastava (@ai_for_success) på X

Mastodon +6 källor mastodon
benchmarksclaudedeepseek
En läcka som publicerades på X av den AI‑inriktade kommentatorn Ashutosh Shrivastava antyder att DeepSeek:s nästa generations stora språkmodell, DeepSeek v4, redan har testats och levererar ett “mycket stort” prestandaskifte. Skärmdumpen, som har spridits brett inom AI‑gemenskapen, visar att DeepSeek v4 överträffar poängen för ledande modeller såsom GPT‑4, Claude 3.5 Sonnet och Gemini 4 i standardtestsviter inklusive MMLU, HellaSwag och HumanEval. Även om DeepSeek ännu inte har släppt ett formellt pressmeddelande, pekar tidpunkten för läckan – bara några veckor efter att företaget annonserade sin v3.5‑utrullning – på en förestående offentlig lansering. Betydelsen ligger i DeepSeek:s positionering som ett kostnadseffektivt, Kina‑baserat alternativ till den västerländska dominansen på LLM‑marknaden. Om benchmark‑siffrorna håller, kan DeepSeek v4 tvinga en omkalibrering av pris‑ och implementeringsstrategier för företag i Europa och Norden, där budgetmedvetna organisationer redan experimenterar med öppen‑källkodsmodeller som LLaMA‑2 och Mistral. En högpresterande, kommersiellt livskraftig modell från en icke‑västerländsk leverantör väcker dessutom frågor kring datasuveränitet, licensiering och den geopolitiska balansen för AI‑makt. Intressenter bör hålla utkik efter tre omedelbara utvecklingar. För det första förväntas DeepSeek:s officiella tillkännagivande – sannolikt med detaljer om arkitektur, token‑gränser och prissättning – inom de kommande två veckorna. För det andra kommer oberoende verifiering av de läckta poängen av tredjeparts‑laboratorier att avgöra om hypen omvandlas till verkliga vinster. Slutligen kommer reaktionen från stora molnleverantörer och AI‑plattformintegratörer i regionen att indikera hur snabbt DeepSeek v4 kan antas i produktionspipeline, särskilt inom sektorer som fintech, hälso‑ och sjukvård samt media, vilka dominerar den nordiska AI‑landskapet.
23

Bindu Reddy (@bindureddy) på X

Mastodon +6 källor mastodon
deepseekopenai
Bindu Reddy, den AI‑inriktade kommentatorn med ett betydande följe på X, meddelade att DeepSeeks fjärde generationens stora språkmodell (LLM) planeras att lanseras senare den här veckan. I sitt inlägg förutspår hon att den nya modellen kommer att placera sig nära toppen av kostnad‑prestandakurvan och erbjuda högre inferenskvalitet utan en proportionell prisökning. Samtidigt påpekade hon att Opus 4.7, den senaste produkten från samma leverantör, är prissatt till ungefär dubbelt så mycket som Opus 4.6, vilket understryker ett växande glapp mellan prestandaförbättringar och prisökningar på marknaden för nästa generations LLM‑er. Som vi rapporterade den 5 april hade Reddy redan lyft fram Opus 4.6:s aggressiva prissättning som ett riktmärke för prisvärda högkvalitativa modeller. Hennes senaste notering visar att de konkurrensmässiga dynamikerna skiftar: DeepSeek satsar på effektivitet för att locka pris‑känsliga kunder, medan Opus verkar positionera sin nyare version som en premium‑tjänst för företagskunder. Meddelandet är betydelsefullt eftersom kostnad‑prestanda är den främsta drivkraften för antagande inom Europas företags‑ och offentliga sektorer, där budgetrestriktioner och frågor om datasuveränitet driver efterfrågan på lokalt hostade eller lågt prissatta API‑lösningar. En modell som levererar GPT‑4‑nivåns flyt till en bråkdel av priset kan påskynda AI‑integration i nordiska fintech‑, health‑tech‑ och offentliga projekt, medan en kraftig prisökning för Opus kan driva utvecklare mot alternativa leverantörer eller öppen‑källkods‑stackar. Det som bör bevakas härnäst är de officiella DeepSeek V4‑specifikationerna och benchmarkresultaten, som förväntas publiceras inom några dagar. Analytiker kommer också att följa hur OpenAI och Anthropic svarar – om de justerar priserna eller påskyndar funktioner – för att behålla sin relevans på en marknad där varje procentenhet i effektivitet översätts till konkret affärsvärde. Prissättningsstrategin för Opus 4.7 kommer sannolikt att klargöras i ett kommande utvecklar‑blogginlägg, vilket ger ytterligare ledtrådar om målgruppen för premium‑nivån.
21

Problem med transformatorer

HN +6 källor hn
Ett joint venture mellan det Oslo-baserade energiföretaget Hafslund EcoPower och AI-startuppen NordicSense har presenterat en maskinläringsplattform som varnar för transformatorfel i realtid, ett steg som kan minska de dyra avbrotten som har plågat de nordiska elnäten i åratal. Systemet, som kallas TranSight, tar in data om spänning, ström och temperatur från en transformators märkdata och jämför dem med en samling av felmönster som härrör från tusentals historiska incidenter. Tidiga fältförsök på en 150 kV högspänningsenhet i södra Norge identifierade en lös bushningsanslutning och en ökande oljeläckagetrend innan utrustningen nådde kritiska temperaturgränser. Varför detta är viktigt går utöver en enskild maskinvara. Elektriska transformatorer är ryggraden i eldistributionsnätverken, och deras fel - antingen på grund av överhettning, inter-turnfel eller isoleringsbrott - kan leda till omfattande strömavbrott, särskilt som regionen är beroende av intermittent vind- och solkraft. Traditionella diagnostiska metoder bygger på periodiska manuella inspektioner, ett förfarande som är både arbetsintensivt och mottagligt för mänskliga fel. Genom att automatisera avvikelseupptäckt lovar TranSight att minska driftstopp, förlänga livslängden på tillgångar och minska den koldioxidavtryck som är förknippad med för tidig utrustningsersättning. Vad man ska se fram emot är distributionsplanen. Hafslund EcoPower planerar att utrusta 30 % av sin högspänningsflotta med plattformen senast 2026, medan Europeiska unionens direktiv för elnätsstabilitet sannolikt kommer att uppmuntra liknande AI-drivna övervakningslösningar i medlemsstaterna. Branschanalytiker kommer också att vara angelägna om att se hur tekniken integreras med befintliga SCADA-system och om den kan skalas upp till de mindre distributionstransformatorer som betjänar landsbygdsområden. Om pilotens framgång översätts till en bredare tillämpning kan AI bli en standard skyddsåtgärd mot de "problem med transformatorer" som länge har plågat elbolag.
20

OpenAI lanserar specialiserad cybersäkerhetsmodell i kapprustning med Anthropic

Mastodon +6 källor mastodon
anthropicclaudegpt-5openai
OpenAI meddelade på tisdagen att de lanserar GPT‑5.4‑Cyber, en härdad variant av sin flaggskeppsmodell GPT‑5.4 som är byggd uteslutande för verifierade cybersäkerhetsproffs. Tjänsten erbjuds via ett slutet betaprogram med strikt granskning, användningsövervakning och revisionsloggar för att förhindra missbruk. Utrullningen sker bara några dagar efter att Anthropic presenterade Claude Mythos, en modell som marknadsförs för “frontier” säkerhetsuppgifter, och gör de två labben till de senaste rivalerna i en spirande AI‑driven cyberförsvars‑kapprustning. Flytten är betydelsefull eftersom defensiva AI‑verktyg har gått från experimentella kuriositeter till operativa tillgångar i hotjakt, incidentrespons och hantering av sårbarheter. Genom att skräddarsy en modell för de specifika vokabulärerna, datamängderna och säkerhetsbegränsningarna i säkerhetsarbetet hoppas OpenAI leverera mer precisa kodgranskningsförslag, snabbare generering av skadlig kod‑signaturer och real‑tids‑triage av larm, samtidigt som risken för att modellen återanvänds för offensiv hackning minimeras. Den slutna åtkomstmodellen signalerar också ett strategiskt skifte: snarare än att släppa ett offentligt API som kan vapnas, satsar OpenAI på ett prenumerationsbaserat partnerskap med företag, MSSP‑leverantörer och myndigheter. Lanseringen eskalerar konkurrensen som startades av Anthropic’s Mythos, som regulatorer började granska för exponering mot bankssektorn i vår rapport den 20 april om Mythos‑relaterade risker. Båda företagen tävlar nu om att vinna säkerhetsteamens förtroende, en marknad som kan bestämma nästa våg av AI‑reglering och standarder. Vad som är att hålla ögonen på härnäst: OpenAI:s onboarding‑kriterier och prissättning kommer att avslöja hur inkluderande erbjudandet blir för mindre företag och nordiska SOC‑team. Anthropic förväntas svara med antingen ett striktare åtkomstregime eller en offentlig säkerhetssvit. Samtidigt är det sannolikt att europeiska dataskyddsmyndigheter kommer att utfärda vägledning om AI‑assisterad cyberförsvar, och varje intrång som involverar en specialiserad modell kan utlösa en regulatorisk gnista som omformar branschens riskhanteringshandbok.
20

Experimentell hybridinferens och nya Gemini-modeller för Android

Mastodon +6 källor mastodon
geminigoogleinference
Google har lanserat ett experimentellt API för “hybridinferens” för Android som låter utvecklare kombinera on‑device‑ och molnbaserade Gemini‑modeller via ett enda Firebase‑gränssnitt. Den nya Gemini‑Nano‑modellen körs lokalt via ML Kit’s Prompt‑API, medan större Gemini‑varianter fortsätter att köras i molnet. En regelbaserad router bestämmer i realtid vilken del av en begäran som stannar på telefonen och vilken som offloadas, vilket lovar snabbare svar, lägre latens och starkare integritet för uppgifter såsom enkelförfrågnings‑textgenerering från korta prompts eller enkla bildinmatningar. Detta är betydelsefullt eftersom Androids fragmenterade hårdvarulandskap länge har tvingat utvecklare att välja mellan hastigheten och offline‑kapaciteten hos små on‑device‑modeller och de rikare funktionerna hos server‑baserade LLM:er. Genom att erbjuda ett enhetligt API vill Google göra “on‑device + moln” till standardarkitekturen, vilket minskar behovet av separata kodvägar och möjliggör smartare avvägningar baserade på nätverksförhållanden, batteristatus eller användarens integritetspreferenser. Tillkännagivandet följer förra veckans Gemini‑prestandaökning, där modellen slog ChatGPT på Implicator LLM Meter, och signalerar Googles avsikt att integrera sin flaggskepps‑generativa AI djupare i mobil‑ekosystemet. Vad som kommer härnäst: Google säger att den hybrida routningslogiken kommer att utvecklas från det nuvarande enkla regelsetet till en inlärd, kontext‑medveten schemaläggare som dynamiskt kan balansera kostnad, latens och datasäkerhet. Utvecklare kan redan experimentera med Firebase Hybrid SDK och en exempelapp som genererar hotell
17

Dyra datacenter kan bli en vändpunkt i mellanårsvalet

Mastodon +1 källor mastodon
climateregulation
Datacenterbyggnation har nått en politisk knäckfråga när USA närmar sig mellanårsvalet i november. En ny utredning från NPR visar att den snabba expansionen av AI-drivna arbetsbelastningar har lett till en våg av megawatt-hungriga anläggningar i delstater från Texas till North Carolina, vilket har resulterat i skenade elräkningar, varningar om belastning på elnätet och en växande kör av lokal motstånd. Rapporten påpekar att federala och statliga subventioner – inklusive skattelättnader för "gröna" datacenterprojekt – nu granskas av lagstiftare som hävdar att de offentliga kostnaderna överstiger de utlovade ekonomiska fördelarna. Samhällen nära föreslagna platser har organiserat protester mot buller, ökad trafik och koldioxidavtrycket från kylsystem som förlitar sig på fossilbaserad kraft. I flera svängande distrikt har kandidater redan vävt in frågan i kampanjrhetoriken, med löften om strängare zonregler och en översyn av de 10 miljarder dollar i skattelättnader som är avsatta för sektorn. Varför det är viktigt går utöver regional irritation. AI-modeller som stora språkmodeller (LLM) förbrukar flera storleksordningar mer beräkningskraft än traditionella molntjänster, vilket översätts till en mätbar andel av den nationella elkonsumtionen. Om det inte kontrolleras kan ökningen undergräva USA:s klimatlöften och ge politiska motståndare till techindustrin en samlande sak, som ekar den "techlash" vi flaggade i vår rapport den 17 april om AI:s växande geopolitiska inflytande. Vad man ska se nästa: senaten förväntas debattera Datacenteransvarighetslagen i juni, en lag som skulle knyta subventioner till verifierad förnybar energitillförsel och införa ett transparensregim för elförbrukning. Samtidigt utarbetar Federal Energy Regulatory Commission och Energidepartementet riktlinjer för bedömning av elnätets påverkan. Resultatet av dessa lagstiftningsåtgärder, och AI-jättarnas svar på en strängare miljögranskning, kommer sannolikt att forma både mellanårsnarrativet och den långsiktiga arkitekturen för USA:s AI-infrastruktur.
17

Martin Varsavsky (@martinvars) på X

Mastodon +1 källor mastodon
Martin Varsavsky, den serieentreprenören bakom Jazztel och flera AI‑inriktade företag, tog till X på torsdagen för att hävda att stora språkmodeller (LLM‑er) snart kan gå bortom rutinmässig automatisering och bli riktiga motorer för vetenskaplig upptäckt. I en kort koreansk‑engelsk tweet skrev han att om en modell kan ”rekonstruera ett paradigmskifte från för‑upptäcktsdata” så skulle den kunna generera nya hypoteser snarare än bara känna igen befintliga mönster. Inlägget, som länkar till en längre tråd, hänvisar till nyliga experiment där LLM‑er har föreslagit livskraftiga molekylstrukturer och identifierat förbisedda korrelationer i klimatdatamängder. Påståendet ansluter sig till en växande kör av forskare som ser generativ AI som en partner i hypotesformulering. Tidigare i år bevisade DeepMinds AlphaFold att AI kan förutsäga proteinveckning med enastående precision, medan verktyg som IBMs RoboRXN och Metas ”Science‑LLM” har börjat utarbeta experimentella designförslag. Varsavskys betoning på ”generering av nya hypoteser” signalerar ett skifte från att använda LLM‑er som datainsamlingsassistenter till att behandla dem som kreativa samarbetspartners som kan föreslå testbara teorier från råa, oetiketterade arkiv. Varför detta är viktigt är tvådelat. För det första kan förmågan att extrapolera från för‑upptäcktsdata påskynda genombrott inom områden där experimentella cykler är kostsamma, från läkemedelsutveckling till förnybar energi. För det andra väcker det frågor om attribution, validering och den mänskliga expertisens roll när AI föreslår nästa vetenskapliga förmodan. Akademiska institutioner håller redan på att utarbeta policyer för AI‑genererade hypoteser, och forskningsfinansiärer avsätter medel till ”AI‑förstärkt upptäckt”-projekt. Det som bör bevakas härnäst är de konkreta pilotprojekten som kommer att sätta Varsavskys vision på prov. OpenAI, Google DeepMind och framväxande europeiska laboratorier har annonserat samarbeten med universitet för att integrera LLM‑er i laboratoriearbetsflöden. De första peer‑reviewade artiklarna som citerar AI‑ursprungliga hypoteser förväntas i slutet av 2026, och deras mottagande kommer sannolikt att forma regulatoriska och etiska ramverk för AI‑driven vetenskap.
12

Modernisering av .NET-applikationer med Visual Studio och Copilot

Mastodon +1 källor mastodon
copilot
Microsoft använde scenen på VS Live! Las Vegas 2026 för att demonstrera ett nytt arbetsflöde driven av artificiell intelligens som lovar att minska den tid som behövs för att modernisera äldre .NET-applikationer. Under en livesession ledd av senior utvecklare och förespråkare Jon Galloway visade företaget hur den senaste versionen av Visual Studio, tätt integrerad med GitHub Copilot, kan automatiskt omstrukturera föråldrad C#-kod, ersätta föråldrade API:er och generera molnklar scaffolding med ett enda kommando. Demonstrationen gick igenom ett typiskt migrations scenario: en monolitisk .NET Framework-applikation skannas, Copilot föreslår moderna .NET 8-ekvivalenter, infogar asynkrona mönster och producerar enhetstester som uppfyller aktuella täckningsstandarder. Visual Studios nya "Modernisera"-flik visar dessa rekommendationer, låter utvecklare acceptera eller justera dem och sedan committar ändringarna direkt till GitHub. Galloway betonade också en ett-klick-alternativ som paketerar den omstrukturerade koden i en Docker-container och föreslår Azure-tjänster för distribution, vilket förvandlar en flera veckor lång insats till en fråga om dagar. Tillkännagivandet är viktigt eftersom många företag fortfarande kör kritiska arbetsbelastningar på .NET Framework eller tidiga versioner av .NET Core, och kostnaden för manuella omskrivningar har bromsat den digitala transformationen. Genom att integrera Copilots generativa funktioner i utvecklingsmiljön syftar Microsoft till att minska den kompetensgap som har tvingat företag att behålla äldre ingenjörer eller outsourca dyra uppgraderingar. En snabbare modernisering förbättrar också säkerhetsläget, eftersom äldre bibliotek ofta är sårbara. Vad man ska se fram emot är distributionsplanen. Microsoft sa att "Modernisera"-förhandsvisningen kommer att vara tillgänglig för Visual Studio 2026-insidare nästa månad, med en bredare allmän tillgänglighet planerad till höstsläppet. Integrationen med GitHub Codespaces och den kommande .NET 9-versionen kommer troligen att fördjupa den artificiella intelligens-assistansen, medan utvecklare kommer att vara angelägna om att se verkliga prestandamätningar och prissättning för Copilot-tilläggen. Draget signalerar en bredare satsning på att göra artificiell intelligens en integrerad del av mjukvaruutvecklingslivscykeln, en trend som kommer att forma verktygsvalen inom den nordiska tech-scenen.
12

Franska åklagare kallar Elon Musk till förhör om påstådda barnmissbruksbilder på X

Mastodon +1 källor mastodon
Franska åklagare har utfärdat kallelser till Elon Musk och den tidigare X‑chefen Linda Yaccarino och beordrat dem att infinna sig i Paris för en ”frivillig intervju” i en utredning om påstådda barnmissbruksbilder som cirkulerar på X‑plattformen. Undersökningen, som initierats av Paris Parquet National Financier, följer ett klagomål om att X inte tog bort eller rapporterade olagligt innehåll tillräckligt snabbt, vilket eventuellt strider mot franska och EU‑lagar om barnskydd. Musk, som förvärvade X år 2022, har upprepade gånger försvarat plattformens modereringspolicy som ”frihet‑för‑yttrandet‑först”, medan Yaccarino, som avgick tidigare i år, fortfarande är senior rådgivare. Deras kallelser signalerar att de franska myndigheterna breddar granskningen bortom företagets tekniska team till dess högsta ledning, ett steg som kan skapa ett prejudikat för att hålla chefer personligt ansvariga för brister i innehållsmoderering. Fallet är betydelsefullt av flera skäl. För det första prövar det räckvidden för EU:s Digital Services Act, som kräver att mycket stora onlinetjänster agerar snabbt mot olagligt innehåll och samarbetar med nationella tillsynsmyndigheter. För det andra ökar det pressen på X, som redan är under kritik för slapp efterlevnad av hatpropagandaregler och desinformationspolicyer, och kan tvinga plattformen att omarbeta sina rapporteringsmekanismer. För det tredje kommer kallelsen i en tid av bredare geopolitisk spänning kring teknikjättars ansvar, och återkallar nyliga europeiska åtgärder mot andra sociala medieföretag. Håll utkik efter ett formellt uttalande från den franska åklagarens kontor som beskriver intervjuns omfattning, samt eventuella svar från Musk eller X:s juridiska team. De nästa stegen kommer sannolikt att omfatta en detaljerad
12

Kids (teenagers) are using computer-assisted development (Claude and others). But what they produce

Mastodon +1 källor mastodon
claude
Tonåringar använder AI‑

Alla datum