AI News

547

Upphaf Claude Mythos frá Anthropic byggir á rangfærslu

Upphaf Claude Mythos frá Anthropic byggir á rangfærslu
Lobsters +8 heimildir lobsters
anthropicclaude
Claude Mythos‑líkanið frá Anthropic, sem hefur fengið mikið umfjöllun, er nú í brennide
404

Anthropic hefur nýlega gefið Claude hönnunastofu. Þetta er hvað Claude Design raunverulega gerir.

Anthropic hefur nýlega gefið Claude hönnunastofu. Þetta er hvað Claude Design raunverulega gerir.
Dev.to +7 heimildir dev.to
anthropicclaudefine-tuning
Anthropic kynnti Claude Design Studio á þriðjudaginn og setti lykil‑LLM‑kerfið sitt í beina keppni við hönnunarumhverfi Figma. Nýja vef‑stúdíóið gerir notendum kleift að lýsa UI‑hugmynd í náttúrulegu máli og fá fullkomna mótsýningu með vektor‑eignum, uppsetningartillögum og litasamsetningum sem passa við vörumerkið. Notendur geta síðan haldið áfram að betrumbæta með því að biðja Claude um að stilla bil, skipta um tákn eða búa til aðra leturgerð, allt innan eins viðmóts sem getur flutt út í hefðbundna hönnunarskrár (Figma, Sketch, Adobe XD). Útgáfan kemur í kjölfar nýjustu útgáfu Anthropic, Claude Opus 4.7, og fyrri “Claude Design” mótsýningar sem við skýrðum um 18. apríl 2026 og sem bentu á prótotýpu með áherslu á markaðssetningu. Af hverju þetta skiptir máli er tvíþætt. Fyrst fær generative AI frá kóða‑miðaðum aðstoðarmönnum eins og Claude Code inn í sjónræna hönnunarrásina, sem gæti minnkað verulega þann tíma sem hönnuðir eyða í lágnivå iteratíön og gert minni teymum kleift að framleiða hágæða frumgerðir án sérstakrar UI‑sérfræðinga. Í öðru lagi, með því að innbyggja líkanið í sérstakt stúdíó í stað viðbótar, forðast Anthropic “AI‑sem‑viðbót” líkanið sem hefur ríkir á markaðnum og setur í spurningu kröfu Figma um að vera eina miðstöð fyrir samvinnuhönnun. Ef Claude Design getur skilað áreiðanlegum, vörumerkjavænum niðurstöðum í stórum mæli, gæti það umbreytt verðlagningu og flýtt fyrir AI‑fyrsta hönnunaraðferðum hjá sprotafyrirtækjum og stofnunum. Það sem á að fylgjast með næst er útgáfa opinberrar beta sem áætlað er í júní, verðupplýsingar sem munu sýna hvort Anthropic stefni að áskriftarlíkani eða gjaldi á hverja framleiðslu, og hvernig Figma‑vörulíkan svarar—hvort sem er með hraðari eiginleikum eða AI‑samstarfi. Jafnframt verður mikilvægt að fylgjast með fyrstu notkunartölum frá hönnunartungum fyrirtækjum og öllum samþættingartilkynningum við núverandi Claude Code og Claude Opus API‑a Anthropic, sem gætu styrkt samræmda AI‑stafla fyrir bæði kóða og hönnun.
394

Kevin Weil og Bill Peebles yfirgefa OpenAI á meðan fyrirtækið heldur áfram að fjarlægja aukaverkefni

HN +8 heimildir hn
openaisora
Kevin Weil, yfirmaður vísindarannsóknarprógrams OpenAI, og Bill Peebles, skapari AI‑vídeóverkfærisins Sora, lýstu á föstudegi yfir að þeir séu að yfirgefa fyrirtækið. Brottför þeirra kemur í kjölfar þess að OpenAI minnkar “aukasíður” og einbeitir sér að fyrirtækjamiðuðu AI‑stefnu sem byggir á væntanlegu “superapp”. Weil hafði yfirumsjón með tilraunum OpenAI á sviði vísindalegs uppgötvunar, þar á meðal takmarkaða GPT‑Rosalind‑líkanið fyrir líffræðirannsóknir. Peebles leiddi Sora‑liðið, sem var lokað í síðustu mánuðinum eftir að OpenAI nefndi óheimilað reiknirit og breytingu frá tilraunakenndum fjölmiðlagerð. Báðar brottförir fylgja í kjölfar fjölda hækkandi stjórnendaskipta sem hófst í byrjun mánaðarins þegar rannsóknaaðstoðarmaðurinn Mira Murati hætti vegna heilsufarsvandamála og fyrirtækið tilkynnti víðtæka umskiptingu í framkvæmdastjórnun sinni. Þessar breytingar eru mikilvægar því þær merkja ákveðna stefnuviðskipti frá hásveifluðum, dýrum verkefnum í átt að vörum sem hægt er að græða í skjótri tíð í fyrirtækjamarkaðnum. Með því að safna hæfileikum í kringum hagnýtt AI vonast OpenAI til að flýta fyrir útgáfu superapp‑ins—einu sameinaðs viðmóts sem mun sameina spjall, kóða, myndir og framtíðarvídeóvirkni fyrir viðskiptanotendur. Missirinn á eldri rannsóknaforystum vekur þó spurningar um langtímahæfni fyrirtækisins til að framleiða byltingarkennda vísindi og gæti leitt til að keppinautar eins og Google DeepMind, sem heldur áfram að fjármagna könnunar AI‑vinnu, fái forskot. Það sem skal fylgjast með næst eru nýir tilnefningar í stað Kevin Weils og Bill Peebles, tímalínan fyrir beta‑útgáfu superapp‑ins og merki um hvort OpenAI muni endurlífa eða aðskilja vídeóframleiðslu eignir sínar. Næstu vikur ættu einnig að sýna hvort þröngun í stefnu leiði til nýrra fyrirtækjasamninga eða hægari flæði í tilraunakenndum rannsóknaferlum.
312

„Frelsisdagur“ hjá OpenAI þegar fjöldi yfirstjórnenda tilkynna brottför

„Frelsisdagur“ hjá OpenAI þegar fjöldi yfirstjórnenda tilkynna brottför
HN +6 heimildir hn
openai
OpenAI tilkynnti á fimmtudag að fjöldi yfirstjórna myndi yfirgefa fyrirtækið, þróun sem samskiptadeild fyrirtækisins kallaði „Frelsisdagur.“ Brottfarirnar ná yfir yfirmann Sora‑vídeóframleiðslutýmisins, yfirmann Force Codex rannsóknardeildarinnar og tvo yfirstjórnenda vöruþróunar sem hafa haft umsjón með útgáfu o1‑rökfræðimódelins. Brottfarirnar voru staðfestar í stuttu innanhússminni og síðar endurspeglaðar í stuttu X‑færslu frá opinbera OpenAI‑reikningnum. Þessi umferð er nýjasta í röð af háttprofíls brottförum sem hafa hrædd stofnunina undanfarna vikur. Eins og við skýrðum 18. apríl, fór fyrrverandi yfirmaður Sora frá fyrirtækinu (sjá „Fyrri yfirmaður Sora hjá OpenAI fer“), og sama daginn sáum við brottfarir Kevin Weil og Bill Peebles, hluta af víðari „afhendingu hliðarverkefna.“ Nýja lotan af uppsögnum dýpkar áhyggjur um innri átök og ágreining um tilbúnað o1‑kerfisins, sem hindra OpenAI í að halda sér á undan keppinautum eins og Anthropic og Google DeepMind. Af hverju þetta skiptir máli er tvíþætt. Fyrst og fremst ógnaðir stjórnendaskipti geta seinkað útgáfu næstu kynslóða módelanna sem OpenAI hefur bent á að muni mynda grunninn að komandi GPT‑5 pakkanum, og gætu þannig látið keppinauta taka markaðsafl. Í öðru lagi koma brottfarirnar á tímabili þegar fyrirtækið er að sækja lögfræðilegan vernd í Bandaríkjunum, nýlega með stuðningi við lög í Illinois sem takmarkar ábyrgð vegna AI‑valdaðra fjöldaáfalla. Óstöðugur yfirstjórnunarteymi gæti veikja samningsstöðu OpenAI við stjórnvöld og fjárfesta, sérstaklega eftir að áhættufjárfestar skráðu stærstu nettölu sölu síðan 2010 á sama fimmtudag. Hvað á að fylgjast með næst: viðbrögð stjórnunar, þar á meðal bráðabirgðaúthlutun eða ytri ráðningar, og hvort útflutningurinn leiði til breytinga í vöruáætlun OpenAI fyrir o1 og GPT‑5. Greiningaraðilar munu einnig fylgjast með næstu fjármálaköllu fyrirtækisins til að leita eftir vísbendingum um hvernig mannauðsþörfin gæti haft áhrif á R&D‑útgjöld og komandi þróunarfundinn sem áætlaður er í júní.
268

Staða sem sameinar samdráttarnet (CNN) og stuðningsvigursvél (SVM) til myndaflokkunar

Dev.to +7 heimildir dev.to
vector-db
Rannsakendahópur frá Indian Institute of Technology hefur kynnt hliðrunarlíkan sem sameinar samdráttarnet (CNN) með stuðningsvigursvél (SVM) til að auka nákvæmni myndaflokkunar. Rannsóknin, sem var sett á arXiv í þessari viku, skiptir hefðbundnu softmax‑lagi í lok CNN út fyrir SVM‑flokkara og fínstillir síðan sameinaða byggingu á viðmiðunargagnasöfnum eins og CIFAR‑10, ImageNet‑hluta og safni af læknisfræðilegum naglaöðrum. Tilkynndir ávinningar spanna frá 1,8 prósentustigum á CIFAR‑10 til áberandi 5,2 stigum á naglaöðrunasafninu, þar sem gögn eru fáin og ójöfnuður í flokkum er alvarlegur. Merkingin felst í því að takast á við tvö langtímavandamál djúpra sjónlíkana. Fyrst geta softmax‑lög að oflíkja þegar þjálfunargögn eru takmörkuð; SVM‑kerfi, með markmiðið um að hámarka bil, eru þolnari í umhverfi með litlum sýnum. Annars
240

Caffeine.ai vs Replit: Af hverju ég breytti Vibe‑kóðun minni yfir á Internet Computer https://www. madeby

Caffeine.ai vs Replit: Af hverju ég breytti Vibe‑kóðun minni yfir á Internet Computer   https://www.  madeby
Mastodon +7 heimildir mastodon
agents
Bloggfærsla með áherslu á forritara, sem kom út á MadebyAgents í þessari viku, lýsir í smáatriðum handvirkri flutningi frá Replit‑kerfinu “vibe‑coding” yfir í Caffeine.ai og að lokum yfir á Internet Computer (ICP) blockchain‑ið. Höfundurinn, sem prófaði sex AI‑stýrð forritunarvettvang, fann að náttúrulega tungumálaviðmótið hjá Replit var notendavænt en var hamlað af óskýrum verðlagi, takmarkaðum útsetningarmöguleikum og vaxandi biðröð fyrir útreikningsauðlindir. Caffeine.ai, nýrari keppinautur sem lofar nánari samþættingu við stór tungumálalíkön (LLM) og fljótari iterasjónarhringum, virtist í upphafi leysa þessi vandamál, en eigið skýjaþjónustukerfi þess hélt áfram að innleiða birgðalás og áhyggjur varðandi persónuvernd gagna. Lykilþátturinn, samkvæmt höfundinum, var desentralíseraða arkitektúr ICP. Með því að þýða kóðann sem er framleiddur í “canisters” – sjálfstæðum snjallsamningum – geta forritarar sett í loftið fullkomlega virk vefforrit án hefðbundins skýjaþjónustuaðila, og njóta nær því engin hýsingarkostnaður, stjórn á keðjunni í sjálfvirkri stjórnun og innbyggðra táknauðkenna til að hvetja til nýtingar auðlinda. Færsla nefnir að ICP‑vistkerfið býður núna upp á tilbúin SDK‑pakki fyrir vinsælar LLM‑bakenda, sem gerir kleift að framkvæma “vibe‑coding” skipanir beint á netinu á meðan notandinn heldur yfir eigin gögnum. Af hverju þessi breyting skiptir máli er tvíþætt. Fyrst bendir hún til þess að AI‑hjálpað forritunarverkfæri séu að þroskast frá sandkassa SaaS‑umhverfum yfir í opna, forritanlegar innviði sem samræmast víðari Web3‑hreyfingu. Í öðru lagi er kostnaðarmunurinn áberandi: ICP getur hýst venjulegt Replit‑stíls forrit á brotum af sent í mánuði, sem er ákjósanleg tilboð fyrir sjálfstæða forritara og sprotafyrirtæki með takmarkað fjármagn. Áhorfendur í framtíðinni munu fylgjast með því hvernig komandi “Canister‑AI” keyrsluumhverfi ICP, sem er áætlað að koma í framkvæmd í þriðja fjórðungi 2026, einfaldar hýsingu líkana og hvort aðrir AI‑kóðunarvettvangar taki upp svipaðar desentralíseraðar útsetningarmódel. Jafnframt verður þróun staðla fyrir öryggi og uppruna skipana lykilatriði, þar sem meira forrit er framleitt og keyrt á opinberum blockchainum. Niðurstaðan gæti umbreytt efnahagslegum þáttum AI‑aukaðrar hugbúnaðarþróunar um allan Norðurlandastefna og lengra út.
193

# Tækni    # Gagnagreining    # Gagnasöfnun   Hvernig á að láta Claude Code bæta sig úr eigin mistökum

# Tækni    # Gagnagreining    # Gagnasöfnun   Hvernig á að láta Claude Code bæta sig úr eigin mistökum
Mastodon +10 heimildir mastodon
claude
Anthropic’s Claude Code hefur tekið skref í átt að sjálflærdóm, eins og nýtt kennsluefni á Towards Data Science, með titlinum „How to Make Claude Code Improve from its Own Mistakes“, lýsir. Leiðbeiningarnar sýna gagnavísindamönnum hvernig á að nota endurtekinn „spyrja‑endurskoða“ lykkju sem gerir Claude Code kleift að merkja, útskýra og sjálfkrafa endurskrifa gölluð kóðaútdrátt án mannlegrar íhlutunar. Með því að fanga villuskilaboð, senda þau aftur inn í módelið og nýta innbyggða greiningartól Claude til rauntíma keyrslu kóða, geta notendur breytt einu mistökum í keðju af smávægilegum umbótum. Þessi þróun er mikilvæg því Claude Code er þegar settur fram sem lágkóða samstarfsaðili fyrir greiningaraðila sem kjósa samtalsverkflæði fram yfir hefðbundna IDE. Eins og við skýrðum 17. apríl, kynnti Anthropic Claude Code vinnuferlið í takt við Opus 4.7 uppfærsluna, með loforð um nánari samþættingu við töflureikna, PDF skjöl og API pípur. Nýja sjálfleiðréttingarmynstrið minnkar „villuleit‑og‑síðan‑spurningar“ mótstöðu sem hefur takmarkað víðtækari notkun, sérstaklega í umhverfum sem vinna með stór, óuppbyggð gagnasöfn. Fyrstu notendur segja að þeir hafi náð um 30 % minnkun á handvirkum endurskrifum þegar þeir vinna með töflur með hálft milljón raðir, ávinningur sem gæti umbreytt því hvernig miðstærðarfyrirtæki ráða starfsmenn til gagna‑greiningarverkefna. Áhorfendur horfa til framtíðar þar sem Anthropic er áætlað að innleiða endurgjöfslúppu beint í Claude AI stjórnborðið, sem breytir handvirkum spurningum í varanlega námsrás. Áætlað er að nýja „Claude Code Auto‑Refine“ eiginleikinn verði hluti af áætlun Q3, og að opinn hugbúnaður viðbætur sem leyfa teymum að flytja út lagfærsluferilinn til fínstillingar verði í boði. Ef sjálfbætandi vinnuferlið skalar, gæti Claude Code orðið fyrsta samtalskóðarinn sem áreiðanlega lærir af eigin villum, og þéttir tengslin milli mannlegrar ásetnings og vélrænna framkvæmda í norræna AI umhverfinu.
150

Að byggja ástandsvirka AI umboðsmenn með Backboard: Ítarlegur djúpdykkur í eiginleikum

Að byggja ástandsvirka AI umboðsmenn með Backboard: Ítarlegur djúpdykkur í eiginleikum
Dev.to +6 heimildir dev.to
agentsautonomousvector-db
Backboard, nýja opna‑kóðasamskiptakerfið sem tilkynnt var í þessari viku, lofar að gera smíði á ástandsvirkum AI umboðsmönnum eins einfalt og að tengja saman nokkur Python‑einingar. Vettvangurinn inniheldur stjórnað vektorgagnasafn (Supermemory.ai), “Runner” samstillir sem fylgist með lotum, verkfæravirkja umboðsmenn og React‑byggt “assistant‑ui” framenda, á sama tíma og hann býður upp á innbyggða krækjur fyrir LangGraph og LangChain. Útgáfan felur í sér tvískjáa Streamlit‑sýningu sem gerir forritara kleift að bera saman óástands‑spjallmenni við Backboard‑knúinn umboðsmann sem heldur utan um samhengi milli umferð, kallar á ytri API‑kerfi og uppfærir sitt eigið þekkingargrunn í rauntíma. Þessi þróun er mikilvæg vegna þess að AI‑markaðurinn er að breytast frá einnota tungumálalíkönum yfir í sjálfstæð kerfi sem geta skipulagt, framkvæmt og lært í gegnum langtímaviðtöl. Viðhald ástands minnkar sóun á táknum, bætir áreiðanleika í áhættustýringu í netverslun og öðrum samræmisþörfandi sviðum, og opnar dyr fyrir “annars heila” forrit þar sem minni umboðsmannsins þróast í takt við notandann. Náttúruleg samþætting Backboard við vektorgagnasafn Supermemory þýðir að forritarar þurfa ekki lengur að flétta saman aðskilda geymslulag, á meðan Runner‑hlutinn tryggir keyrslu í sandkassa—vandamál sem við bentum á í skýrslu okkar frá 17. apríl um nýja sandbox‑SDK OpenAI. Áhorfendur í framtíðinni munu fylgjast með hversu fljótt Backboard verður tekið upp í vaxandi LangGraph‑vistkerfinu og hvort skýja‑hýst þjónustan geti haldið í takti við nýrri viðmiðanir eins og RiskWebWorld. Næsta umferð uppfærslna er væntanleg að innihalda fjöl‑umboðsmanna samstilltar aðgerðir og dýpri mann‑í‑rásinni stjórnun, sem gæti fest Backboard í sessi sem sjálfgefna verkfærakistu til að byggja framleiðslu‑gæðafullt, ástandsvirkt AI aðstoðartól. Þegar fyrirtæki prófa sjálfstæð umboðsmenn verður hæfni vettvangsins til að stækka minni á öruggan hátt lykilatriði.
148

Anthropic forstjóri mætir aðalstarfsmanni Hvíta húss í leit Bandaríkjanna að aðgangi að Mythos líkani

Mastodon +8 heimildir mastodon
anthropic
Forstjóri Anthropic, Dario Amodei, hitti aðalstarfsmann Hvíta húss, Susie Wiles, fjármálaráðherra Scott Bessent og aðra háþróaða starfsmenn á föstudegi til að ræða nýjasta stórt tungumálalíkani fyrirtækisins, Mythos. Fundurinn í Vesturhluta, sem þátttakendur lýstu sem „árangursríkur“, var fyrsta hárstigs samtalið milli stjórnvalda og AI-fyrirtækisins síðan Anthropic tilkynnti að það myndi fresta víðtækari útgáfu Mythos þar til það gæti tryggt öryggi líkanins og viðnámsþol gegn misnotkun. Fundurinn er mikilvægur vegna þess að Mythos er almennt talinn vera eitt af hæfileikaríkustu generative‑AI kerfunum á markaðnum, í samkeppni við lausnir frá Meta, Google og OpenAI. Bandarískir embættismenn eru spenntir að tryggja aðgang fyrir öryggis‑áætlanir, reglugerðarprófanir og til að meta hvort líkanið uppfylli nýrri öryggisstaðla. Anthropic glímir á sama tíma
142

Hvað er Mythos og af hverju eru sérfræðingar áhyggjufullir um AI‑líkanið frá Anthropic

Hvað er Mythos og af hverju eru sérfræðingar áhyggjufullir um AI‑líkanið frá Anthropic
Mastodon +8 heimildir mastodon
anthropic
Anthropic nýjasta stórt tungumálalíkanið, Claude Mythos, hefur verið dregið úr opinberri útgáfu eftir að innri prófanir sýndu óviðjafnanlega hæfni til að finna og nýta sér hugbúnaðargalla í helstu stýrikerfum. Fyrirtækið tilkynnti að líkanið getur framkallað virk nýtingarkóða, kortlagt ferla til að auka réttindi og jafnvel búið til phishing‑gögn með lítilli mannlegri aðstoð. Nokkrum klukkustundum eftir tilkynninguna héldu fjármálaráðherrar, seðlabankar og eldri bankastjórar neyðarfundir og varðu við því að tækið gæti veitt illgjarnum aðilum „ofmannlega“ yfirburði í netárásum á lykilinnviði fjármálakerfa. Úrslitin hafa kveikt ábyrga þrýsting. Yfirstjórar upplýsingatryggingar og netöryggisfyrirtæki, sem gætu hagnýtt sér aukinn eftirspurn eftir varnarmöguleikum, krefjast opinberlega tafarlausrar aðgerða; greiningar segja að þessi hvati endurspegli sjálfverulega sjálfvernd stofnana jafnvel eins og raunverulega áhættumat. Evrópskar og bandarískar yfirvaldar eru nú þegar að útbúa neyðarreglur í samræmi við AI‑lögin og framkvæmdalöggjöf um AI‑knúna ógnir, á meðan nokkur landsöryggisstofnun hafa sett Anthropic á eftirlitslista. Af hverju þetta skiptir máli fer langt umfram eitt tiltekinn vara. Mythos sýnir að gerandi gervigreind getur flutt úr tungumálaverkefnum í sjálfstæða uppgötvun á öryggisgöllum, og minnkar tímabilið milli rannsókna og vopnabúnaðar sem hefðbundið hefur verndað verjendur. Ef slík hæfni verður almennt aðgengileg, gæti kostnaður við að verja stýrikerfi, bankakerfi og stjórnunarnet í ríki sprengst í loft, breyta netöryggismarkaðnum og kalla á endurskoðun á stjórnunarramma AI‑tækni. Það sem á að fylgjast með næst: nýja áhættustigun ESB um „tvínota“ líkön, möguleg lögfræðileg ágreiningur frá fyrirtækjum sem telja sig vera í áhættu, áætlun Anthropic um að gefa út harðaða, „sandkassaða“ útgáfu, og hvort samkeppnisaðilar reyni að innleiða svipaðar nýtingar‑einingar í eigin lausnir. Næstu vikur munu sýna hvort Mythos kallar á umbyrtingu reglugerða eða verður hvati að nýrri varnarmótstöðu í AI‑vopnakapphlaupi.
124

Skilningur á Transformerum, hluti 9: Stökun sjálfhugsunar laga

Skilningur á Transformerum, hluti 9: Stökun sjálfhugsunar laga
Dev.to +6 heimildir dev.to
Nýjasta þáttur í “Skilningur á Transformerum” seríunni, sem kom út í dag, varpar ljósi á framkvæmdina að stapla sjálfhugsunar lag. Með því að byggja á þyngdar‑deilingu hugmyndunum sem voru greindar í hluta 8 þann 17. apríl, útskýrir nýja greinin hvernig mörg, sjálfstætt parametrísuð athyglublokkir eru sett í lag til að gera líkaninu kleift að ná yfir sífellt abstraktari tengsl innan runu. Höfundurinn fer í gegnum hefðbundnu hönnunina á eingöngu kóðunaraðila og eingöngu afkóðunaraðila sem kynnt var í upprunalega greininni “Attention Is All You Need”, og sýnir að hvert lag tengir fjölhöfuð sjálfhugsunar undireiningu við framþrýstingarnet. Með því að stapla þessi pör geta transformerar farið fram úr einlagatakmörkuninni sem var
118

Ivan Fioravanti ᯅ (@ivanfioravanti) á X

Mastodon +8 heimildir mastodon
agentsanthropic
Anthropic nýjasta tungumálalíkani, Opus 4.7, hefur kveikt á bylgju af áhuga meðal hönnuða eftir að tæknaráðgjafi Ivan Fioravanti sendi tíst þar sem hann lagði áherslu á „Lovable‑level“ áhrif líkanið hefur á vinnuferla við smíði forrita. Fioravanti, sem stjórnar AI‑miðaðum verkefnum hjá CoreView, sagði að hönnunargenereringar nýja líkanisins séu svo þróaðar að notendur íhuga að segja upp núverandi áskriftum að hönnunarverkfærum til að nota ókeypis, AI‑knúna lausnina. Opus 4.7 byggir á Anthropic „Claude“ ættinni en bætir við fjölbreytilegu kjarna sem getur túlkað sjónræna fyrirmæli, unnið ítrekað á UI‑útlitsgerð og lagt til hönnunarbætur í rauntíma. Snemma notendur tilkynna að líkanið geti framleitt hágæða vírulínur út frá einni setningarlýsingu, sjálfkrafa lagað litapallettu að vörumerkjareglum og jafnvel búið til front‑end kóðaútdrátt sem keyrir án handvirkrar fínstillingar. Hraði og nákvæmni þessara úttaka er áberandi skref frá fyrri Opus 4.0 seríunni, sem kröfðist umfangsmikillar eftirvinnslu. Þessi þróun er mikilvæg því hönnun hefur lengi verið flöskuháls í hugbúnaðarafhendingu. Með því að láta LLM taka á sig daglegan UI‑framleiðslu geta vöruteymi stytt þróunartímabil, minnkað áreiðanleika á sérfræðihönnuðum og lækkað kostnað. Fyrir breiðari AI‑markaðinn eykur frumúr Anthropic samkeppni við OpenAI GPT‑4.5 og Google Gemini‑1, og ýtir iðnaðinum í átt að sértækari, sviðsvísum líkanum frekar en almennum textagenerátorum. Það sem á eftir að fylgjast með er útfærsluáætlun Anthropic. Fyrirtækið hefur bent á stigveldisverðlagningarmódel sem gæti gert Opus 4.7 aðgengilegt nýsköpunarfyrirtækjum á meðan fyrirtækjareikningar yrðu rukkaðir fyrir hærri umferð í API. Samstarf við hönnunarvettvang eins og Figma, Sketch og Adobe XD er áætlað á næstu mánuðum, og samanburðarrannsóknir sem bera Opus 4.7 saman við samkeppniverkfæri eru áætlaðar til útgáfu seinna á þessu fjórðungi. Eins og við skýrðum 14. apríl er áskorunin nú ekki aðeins að byggja öfluga LLM‑a heldur að leiðbeina notendum um hvernig nota á þau án „töfrarútsendinga“ – próf sem Opus 4.7 mun brátt mæta í raunveruleikanum.
108

Claude Design, Opus 4.7 til baka, GPT‑5.3 og KIMI K2 viðmiðunartölur

Claude Design, Opus 4.7 til baka, GPT‑5.3 og KIMI K2 viðmiðunartölur
Dev.to +6 heimildir dev.to
anthropicbenchmarksclaudegpt-5
Anthropic kynnti í dag Claude Design, umhverfi í vafra sem gerir notendum kleift að teikna, smíða og betrumbæta vefuppsetningar með aðeins einu skipun. Verkefnið byggir á hönnunarstúdíó‑prótotýpinu sem við fjölluðum um þann 18. apríl, þegar fyrirtækið opnaði “Design Studio” fyrir Claude, og bætir við sjónrænu striga, íhlutabókasafni og rauntímaforskoðun sem er knúin af nýjustu Claude Opus 4.7 líkaninu. Kynningin kemur í kjölfar fjöls konar kvörtunar frá forritara um að Opus 4.7 sé að sýna “alvarlega til baka” í áreiðanleika. Fyrstu notendur skrá í sér hærri tíðni af rangfærðum CSS-reglum og stundum hrun þegar unnið er með stórar táknaglugga, í skarpari mótsögn við viðmiðunartölur líkanins sem voru birtar í síðasta mánuði—87,6 % á SWE‑bench Verified og framúrskarandi yfir GPT‑5.4 í kóðunaráhrifamælingum. Anthropic hefur enn ekki gefið út formlegan lagfæringu, sem vekur áhyggjur um að hraði nýrra eiginleika sé að yfirgnæfa stöðugleika líkanins. Samtímis voru nýjar viðmiðunartölur um pólitískar hliðar í GPT‑5.3 og opna kóðann KIMI K2 gefnar út, sem varpa ljósi á hvernig stór tungumálalíkön bregðast við umdeildum spurningum. Prófanirnar, sem gerðar voru af sjálfstæðu samstarfi norrænna háskóla, sýna að GPT‑5.3 heldur 92 % hlutleysi, á meðan KIMI K2 stendur á 78 %, sem bendir til þess að Claude‑miðaða hönnunargögn gætu orðið áberandi keppnisforskot ef kjarnalíkanið nái að stöðvast. Hvað á að fylgjast með næst: Anthropic er líklegt til að gefa út lagfæringu fyrir Opus 4.7 innan næstu tveggja vikna, og fyrirtækið hefur bent á “Claude Design Pro” stig sem mun innleiða útgáfustýringu og hópsamvinnu. Á sama tíma hyggst viðmiðunarsamfélagið birta fjórðungsuppfærslu sem mun innihalda fjöltyngda hlutleysi-prófanir, mælikvarða sem gæti haft áhrif á ákvörðun fyrirtækja um innleiðingu í Evrópu. Hagsmunaaðilar ættu að fylgjast með bæði tæknilegri lagfæringu Opus 4.7 og þróun frammistöðu samkeppnisaðila í takt við að AI‑knúna hönnunarmarkaðurinn hitnar.
108

Anthropic sýnir Claude Design til að smíða glæsilegar nýjar bleikar pappírslipar fyrir markaðsteymi

Anthropic sýnir Claude Design til að smíða glæsilegar nýjar bleikar pappírslipar fyrir markaðsteymi
Mastodon +7 heimildir mastodon
anthropicclaude
Anthropic kynnti Claude Design á föstudegi, rannsóknar‑forskoðunartæki sem gerir notendum kleift að búa til sjónræna eignir á markaðsstigi með því að bara spjalla við Claude‑líkanið. Frumgerðinni er hægt að framleiða allt frá borðbanni til „glæsilegra nýrra bleikra pappírslipa“ sem sýndir voru í kynningunni, og setur samtals‑gervigreindina sem framenda fyrir myndsköpun sem fer fram umfram hefðbundin hönnunartól. Útgáfan byggir á nýlegri útbreiðslu Anthropic í gerð kóða með Claude Code, umfjöllun sem við fjölluðum í byrjun vikunnar. Með því að stækka Claude-fjölskylduna yfir í sjónræna miðla stefnir fyrirtækið að því að lækka tæknilegan þröskuld fyrir framleiðslu á fínlegum myndum, skref sem gæti umbreytt því hvernig markaðsteymi afla sér skapandi verk. Claude Design keyrir á sérstökum notkunarmælum og vikulegum takmörkum, sem gefur til kynna að Anthropic hyggist líta á það sem sjálfstæða vöru línu frekar en bara viðbót við núverandi þjónustu. Af hverju þetta skiptir máli er tvíþætt. Fyrst kemur þjónustan inn í þröngt markaðsumhverfi þar sem myndamiðaðir líkön eins og Midjourney, DALL‑E og Stable Diffusion ríkja, en hún aðgreinir sig með aðeins texta‑viðmóti sem lofar hraðari umferð fyrir þá sem eru ekki hönnuðir. Í öðru lagi vekur auðveld AI‑stýrð myndaframleiðsla spurningar um framtíð fagfólks í hönnun og eignarhaldsréttindi á myndunum, í takt við áhyggjur sem hafa komið upp í tengslum við Mythos‑líkan Anthropic og möguleikann á misnotkun. Það sem á eftir að fylgjast með eru meðal annars verðstefna Anthropic og hvort Claude Design verði samþætt við núverandi hönnunarforrit eða skýja­vettvang eins og AWS. Greiningarmenn munu einnig fylgjast með getu líkansins til að virða vörumerkjareglur, höfundarréttarlög og framleiða hágæða myndir í hárri upplausn í stórum mæli. Fullkomin opinber útgáfa, notendaviðbragða‑hringrásir og möguleg samstarf við auglýsingatæknifyrirtæki munu ákveða hvort Claude Design verði litla tilraun eða hvati að víðtækari umbreytingu í átt að samtals‑miðaðri myndsköpun.
103

Hvernig Claude Code tekst á við 200 000 tákn án að missa greind

Hvernig Claude Code tekst á við 200 000 tákn án að missa greind
Dev.to +6 heimildir dev.to
agentsclaudegemini
Anthropic hefur kynnt nýja arkitektúr fyrir samhengisglugga í Claude Code sem teygir minni líkanins í um það bil 200 000 tákn á meðan það viðheldur samhengi. Framsækið byggir á rauntíma samantektarvél sem þjappar fyrri samtali í þéttar innfelldar (embeddings), sem gerir líkanið kleift að vísa í mun stærri kóða-uppsafn eða margtímalausa villuleitarsessíu án þess „greindarleysis“ sem venjulega neyðir forritara til að endurræsa umhverfi eftir nokkur mínútur. Uppfærslan er mikilvæg því hún fjarlægir langtímabottleneck í AI‑stýrðum þróunartólum. Fram til nú voru jafnvel hæfileikaríkustu umhverfin – Claude Opus 4.7, sem fór í almenna notkun í síðustu viku – takmörkuð við 128 k tákn, sem þvingaði notendur til að handvirkt klippa eða skipta upp löngum samtölum. Með því að sjálfkrafa draga út fyrri samhengi getur Claude Code fylgst með víðfeðmum verkefnum, stórum endurskoðunum eða end-to-end prófunarsettum í einni lotu. Fyrstu innri viðmiðunartölur sýna 30 % minnkun á tafaríðum tengdum táknum og áberandi minnkun á ranghugmyndum þegar líkanið fer aftur yfir eldri kóðaútdrátt. Fyrir teymi sem hafa þegar innleitt Claude Code í sjálfvirkar kóðaskoðanir og pörforritun lofar breytingin eftirfarandi: sléttari vinnuflæði og minni rekstrarkostnaður. Útgáfan frá Anthropic er í upphafi takmörkuð við greiddar áskriftir með kóða‑keyrslu virkjuð, í samræmi við stefnu sem lýst er í skýrslu okkar frá 18. apríl um sjálfsamantekt Claude Code. Fyrirtækið segir að kerfið verði fínstillt út frá raunverulegum notkunargögnum og að verðlagning muni vera óbreytt. Hvað á að fylgjast með næst: ítarleg frammistöðugögn úr komandi “Long‑Context” viðmiðunarröð, möguleg útbreiðsla samantektarlagsins yfir á Claude Opus og Claude Sonnet, og hvernig keppinautar – OpenAI‑GPT‑4‑Turbo og Google‑Gemini – bregðast við þrýstingi á mjög langa samhengisglugga. Ef Anthropic getur haldið kostnaðarlínunni flötum á meðan minni stækkar, gæti Claude Code orðið sjálfgefið vélbúnaður fyrir AI‑umhverfi sem þurfa að rökstyðja yfir heildar kóðasöfn án truflana.
102

Show HN: Sfsym – Flytja út Apple SF Symbols sem vektor SVG/PDF/PNG

Show HN: Sfsym – Flytja út Apple SF Symbols sem vektor SVG/PDF/PNG
HN +5 heimildir hn
applevector-db
Nýtt opið‑kóða tæki sem heitir **sfsym** gerir forritara og hönnuðum kleift að flytja út Apple SF Symbols beint frá skipanalínunni sem SVG, PDF eða PNG skrár. Verkfærið, sem er sett á GitHub af yapstudios undir MIT-notkunarleyfi, tengist macOS‑aðeins SFSymbols.app og býður upp á einfalt setningafræði – til dæmis, `sfsym get heart.fill > heart.svg` – til að sækja hvaða af fleiri en 6.900 táknum sem kynnt voru í SF Symbols 7, með valfrjálsum þyngdar- og skala‑viðföngum. Útgáfan er mikilvæg vegna þess að SF Symbols hafa orðið sjálfgefna táknasafnið fyrir iOS, macOS og watchOS forrit, en Apple býður aðeins upp á þau sem eigandi takmarkaðar eignir innan hönnunarfor
89

Fyrir alla sem nota GitKraken og Claude Code – GitKraken hefur (eða mun líklega í uppfærslu) breytt

Fyrir alla sem nota GitKraken og Claude Code – GitKraken hefur (eða mun líklega í uppfærslu) breytt
Mastodon +6 heimildir mastodon
claudecopilot
GitKraken‑skrifborðsklientinn hefur í leynilegri aðferð breytt stillingaskránni sem Anthropic‑Claude Code notar, með því að setja inn röð skipanalínukrofa sem beina öllum spurningum sem notandi slær inn í Claude í gegnum GitKraken‑CLI. Breytingin, sem fannst í skránni %appdata%/.claude/settings.json, virðist beina notendainntakinu til ótilgreinds enda áður en svar er skilað, og setur þannig óáþekkjanlegan millilið inn í AI‑stuðningskóðunarvinnslu. Breytingin er mikilvæg vegna þess að Claude Code er markaðssett sem öruggt, á staðnum (on‑premise) aðstoðartól til að búa til og endurskipuleggja kóða. Með því að beina beiðnum í gegnum eigin verkfæri GitKraken gæti fyrirtækið skráð, flýtt í skyndiminni eða jafnvel sent eignarleg brot af kóða til netþjóna utan stjórnunar notandans. Fyrir forritara í reglugerðum iðnaði—eða hvaða teymi sem lítur á grunnkóða sem trúnaðarmál—kallar þetta fram tafarlausa áhyggjur varðandi samræmi og persónuvernd gagna, sérstaklega í ljósi GDPR og norrænnra persónuverndarreglna. Þetta dregur einnig upp skugga á mörkin milli þægindaaðgerðar og hugsanlegs gagnaútláts, í takt við nýlegar athuganir á AI‑samþættingu í þróunarmiljöum. GitKraken hefur enn ekki gefið út opinberan yfirlýsingu, en breytan er líklega tengd víðtækari AI‑útgáfu fyrirtækisins sem sameinar Claude, Copilot, Cursor og aðra aðstoðarmenn í eina „AI‑viðmót“ í notendaviðmótinu. Notendur geta væntað fljótlegan viðbragð: lagfæringu til að fjarlægja krofana, skýring á hvar gögnin eru send, og mögulega nýja stillingu til að slökkva á ferlinum. Anthropic gæti einnig komið fram til að fullvissa viðskiptavini um að persónuverndarábyrgðir Claude haldist óbreyttar þegar aðgangur er í gegnum verkfæri þriðja aðila. Það sem á eftir að fylgjast með eru opinber skilaboð GitKraken, allar uppfærslur á Claude‑Code viðbótinni, og hvort önnur IDE eða Git‑GUI taka upp svipaða falda leiðsendingu. Reglugerðarstjórnir í ESB og Skandinavíu gætu einnig rannsakað þessa aðferð ef hún er talin brjóta gegn samþykki notenda, sem gerir næstu vikur lykilatriði fyrir bæði forritara og birgja.
87

Claude Code Opus 4.7 heldur áfram að fylgjast með skaðlegum hugbúnaði

Claude Code Opus 4.7 heldur áfram að fylgjast með skaðlegum hugbúnaði
HN +6 heimildir hn
anthropicclaude
Claude Code Opus 4.7, nýjasta útgáfan af þróunarfókusetu LLM frá Anthropic, innfelur nú stöðuga skaðlegum hugbúnaðar‑viðvörunarlúppu í hverja kóðagenereringarbeiðni. Uppfærslan, sem var tilkynnt í stuttu bloggfæri á mánudaginn, stækkar öryggismótið sem kynnt var með Opus 4.6, sem þegar nýtti mannlega rökstuðning til að greina veikleika. Opus 4.7 fer enn lengra með því að vísa framleiddum brotum til nýjustu ógnagagnasafns, merkja þekktar illgjarnar mynstur, grunsamleg API‑köll og kóða sem samsvarar undirskriftum af ransomware, cryptominers eða birgðakeðjuárásum. Þegar áhætta er greind, setur líkanið sjálfkrafa inn viðvörunarkomment og leggur til öruggari valkosti, á sama tíma og það skráir atvikið til endurskoðunar í samþættum IDE‑um eins og GitKraken. Aðgerðinni er mikilvæg vegna þess að AI‑framleiddur kóði verður fljótt ómissandi í fyrirtækja‑vinnuferlum, en greinin hefur átt í erfiðleikum með að tryggja að sömu líkön drepi ekki óvart skaðlegan hugbúnað. Með því að innbyggja rauntíma skönnun í framleiðsluferlið stefnir Anthropic að því að loka mikilvægu bili sem hefur hingað til takmarkað innleiðingu í reglugerðarstuddum geirum eins og fjármálum og heilbrigðisþjónustu. Eiginleikinn greinir einnig Claude Code frá Codex‑byrjuðum lausnum OpenAI, sem enn byggja á eftirfylgni með stöðugum greiningartólum. Eins og við skýrðum 18. apríl, kynnti Opus 4.6 þegar 1 milljón‑tákna samhengi og fjöl‑umferðarmiðlun; öryggisáhersla Opus 4.7 byggir á þeirri undirstöðu og gæti orðið de‑facto staðall fyrir AI‑hjálpað þróun. Fylgist með næstu vegvísindum Anthropic, sem væntanlega verða opinberaðar á næstu vikum, þar sem Op
80

Anthropic kynnir Claude Opus 4.7 – minna öflugt en Mythos

Mastodon +6 heimildir mastodon
agentsanthropicclaude
Anthropic kynnti Claude Opus 4.7 þann 16. apríl og setti það fram sem nýjustu umhverfis‑miðaða líkanið fyrirtækisins til hugbúnaðarframleiðslu og fjárhagsgreiningar. Líkanið
72

FOSDEM 2024: Árleg þing frjáls fræða í Brussel

Mastodon +7 heimildir mastodon
Árlega frjáls fræðaþingið FOSDEM sneri aftur til Brussel 3.-4. febrúar 2024 og dregði þúsundir forritara til Université Libre de Bruxelles fyrir pakkaða tvær daga áætlun. Meðal 875 atburða stóð AI og vélamótað devroom út, með röðum fyrirlestra sem skoðuðu innri vinnslu stóra tungumálamódela og nýjasta lág-rank subspace finetuning aðferðir. Fyrirlesarar frá bæði akademíu og iðnaði fóru í gegnum praktíska útfærslur, benchmark niðurstöður og opna fræða verkfæri sem lækka þröskuldinn til að prófa margir milljarða færa módel. Áhrif þessara fyrirlestra strekkja sig út fyrir ráðstefnusalina. Með því að birta transformer byggingu og finetuning pípur til víðfeðma opna fræða áhorfendur, hraðar FOSDEM útbreiðslu nýjustar AI rannsókna í Norðurlöndunum, þar sem smærri fyrirtæki og rannsóknarstofnanir byggja á samfélagsskipaðri rammi. Áherslan á endurtekinni, lágauðna finetuning stemmir vel við svæðisáhrif um sjálfbæra og upplýsingafræði, og bjóðar upp á leið fyrir minni liði til að sérsníða kraftmikla módel án þess að þurfa miklar reiknibúnaðarfé, sem áður var krafist. Í framtíðarútsýni er líklegt að mótið sem myndast á FOSDEM muni koma til margra konkretna þróananna. Skipuleggjendur tilkynntu að fyrirlestrarnir og meðfylgjandi glæruskjalir verði varðveittir á vefsíðu FOSDEM, og munu þar af leiðandi vera varanlegur auðlind fyrir forritara sem misstu bein fyrirlestrana. Fleiri fyrirlesarar víkuðu til að útgáfur opna fræða bókalfanna væru á því að koma, sem tengja beinlínis umræddar lág-rank aðlögunaraðferðir í vinsælar rammar eins og PyTorch og TensorFlow. Auk þess hefur samfélagssvörun þegar vaknað athygli á sérstakan Norðurlanda AI devroom fyrir FOSDEM 2025, þar sem svæðisverkefni gætu sýnt sérfræði lausnir og myndað cross-border samvinnu. Áhugasamir eiga að halda auga á FOSDEM tilkynningu um devroom síðar á þessu ári og á GitHub geymslur sem tengjast febrúar fyrirlestrunum fyrir fyrsta bylgju opna fræða framlaga.
72

Mismunur á aðgangsstýringalista og hæfileikaskrá - GeeksforGeeks

Mismunur á aðgangsstýringalista og hæfileikaskrá - GeeksforGeeks
Mastodon +7 heimildir mastodon
gpu
GeeksforGeeks hefur gefið út nýja kennsluefni sem greinir klassíska öryggisdeilu milli aðgangsstýringalista (ACLs) og hæfileikaskráa. Greinin, birt 9. febrúar 2024, leiðir lesendur í gegnum hlutmiðaða ACL‑líkanið – þar sem hver auðlind býr yfir lista yfir notendur og leyfðar aðgerðir – og ber það saman við efnismiðaða hæfileikaskrána, sem safnar réttindum í óbreytanlegum táknum sem notandinn heldur. Greinin bendir einnig á að hratt vaxandi umfang stórra tungumálalíkana (LLM) – sem vaxa tvö til fimm sinnum hraðar en minni í einu GPU getur fylgt – hefur endurnýjað áhuga á léttum, táknbyrðum heimildakerfum fyrir AI‑vinnslu. Af hverju tímasetningin skiptir máli er tvíþætt. Fyrst er AI‑geirinn í baráttu við að veita fínstillta, endurskoðanlega aðgang að sífellt stærri líkönum án þess að draga úr frammistöðu. Hefðbundnir ACL‑ar, vel þekktir gagnagrunnsstjórendum, geta orðið flöskuháls þegar milljarðar ályktunarbeiðna þurfa að vera yfirfarnar í rauntíma. Hæfileikastíls‑tákn, á móti, geta verið fest við líkanabrot eða ályktunarverkefni og staðfest í staðbundinni umhverfi, sem dregur úr töf og einfaldað er stefnumótun. Í öðru lagi fellur umræðan í takt við nýlegar stefnumótunarhreyfingar: eins og við skýrðum 18. apríl, hittist forstjóri Anthropic við aðstoðarmann White House til að ræða um aðgang að Mythos‑líkaninu, samtal sem byggir á öruggum, skalanlegum heimildarrammum. Áhorf til framtíðar sýnir að samfélagið mun fylgjast með hvort stórir skýjaþjónustuaðilar taki upp hæfileikamiðaðar API‑kerfi fyrir líkanaframboð, og hvort staðlaþing eins og Cloud Security Alliance setji fram leiðbeiningar sem sameina arfleifð ACL‑a með sveigjanleika táknbyrða kerfa. GeeksforGeeks‑leiðbeiningin gæti orðið viðmið fyrir verkfræðinga sem eru ábyrgir fyrir að styrkja AI‑pípur, sérstaklega þar sem reglugerðarstofnanir ýta að gagnsæjum, endurskoðanlegum aðgangsstýringum í vaxandi umhverfi gerandi AI.
72

P4: FOSDEM 2024 ónettengt [2024‑02‑09 föstudagur] þjálfanlegir breytur. Lágraða‑undirsvæðis fínstilling.

P4: FOSDEM 2024 ónettengt [2024‑02‑09 föstudagur] þjálfanlegir breytur. Lágraða‑undirsvæðis fínstilling.
Mastodon +13 heimildir mastodon
embeddingsfine-tuning
Lið rannsakenda kynnti nýjan aðferð til að fínstilla gríðarleg tungumálalíkön á FOSDEM 2024 og sýndi fram á að aðeins lítil skammtur af breytum líkanins þarf að uppfæra til að ná verkefnisbundinni frammistöðu. Kynningin, með titlinum „P4: Offline Low‑Rank Subspace Fine‑tuning“, sýndi hvernig inntak‑innfelldarlagið (input‑embedding layer) er hægt að aðlaga með gradient‑niðurstöðu á meðan aðalhluti netkerfisins er frystur. Lykiltrixið er tvíþætt. Fyrst endurstillir Fastfood‑umbreytingin þyngdaruppfærslur, breytir þéttum gradientum í þéttan hóp af handahófskenndum vörpunum sem eru ódýrar í útreikningum og geymslu. Í öðru lagi byggir aðferðin á LoRA (Low‑Rank Adaptation) og setur inn lágraða fylki — eða samsvarandi Kronecker‑vörpun — í hvert transformer‑lag. Með því að frysta for‑þjálfaða þyngdir og aðeins læra þessi lágraða þættir minnkar fjöldi þjálfanlegra breyta frá milljörðum í nokkur þúsund, sem dregur minnkað minni- og reiknivélarþörf í ský. Af hverju þetta skiptir máli er að tækni þessi gerir aðlögun líkana á tæki eða á jaðrinum (edge) mögulega án þess að fórna gæðum stórra for‑þjálfunarlíkana. Eins og við skýrðum 15. apríl, keyrir Google‑Gemma 4 nú fullkomlega ónettengt á iPhones, en fínstilling á slíkum takmarkaðum vélbúnaði hefur enn verið óraunhæf. Nýja lágraða‑undirsvæðisaðferðin gæti brennt bilið, og gert persónuleg gervigreindaraðstoðarmenn, sérsniðna spjallmenni og persónuverndarvænar forrit sem læra staðbundið af notendagögnum möguleg. Næstu skref sem vert er að fylgjast með eru útgáfa opins uppruna (open‑source) útfærslu, líklega í gegnum TensorFlow‑Parameter‑Server vistkerfið, og innleiðing í vinsælar bókasöfn eins og PyTorch‑Lightning. Viðskiptavinir í iðnaðinum gætu fljótlega innbyggt aðferðina í SDK‑pakka fyrir snjalltæki og IoT‑tæki, á meðan fræðilegar hópar eru að undirbúa samanburð við full‑líkan fínstillingu á staðlaðum NLP‑prófunarsöfnum. Ef fyrstu niðurstöðurnar standast, gæti lágraða ónettengd aðlögun orðið hornsteinn í næstu öld AI á jaðrinum.
72

Claude Opus 4.7 og upphaf loksins á gnægð í AI

Dev.to +6 heimildir dev.to
claudegpt-5
Claude Opus 4.7 kom í fyrirsögnir í dag ekki aðeins vegna tæknilegra fínstillinga, heldur einnig vegna þess að hún kom með íhugaðri grein sem varar við „upphafi skortleika í AI“. Eftir tvö ár af sífellt ódýrari og sífellt hæfileikaríkari módelum virðist nýja útgáfan vera fyrsta merki þess að markaðurinn sé að missa ódýra útreikninga og leyfisrými sem knúðu nýlegum uppgangi. Uppfærslan Opus 4.7, sem Anthropic birti á þriðjudaginn, þrengir innri öryggislöggun sína, bætir við áreynslulegri skaðlegum hugbúnaðar greiningarvinnslu og minnkar fjölda breytistærða módelins til að draga úr útreikningskostnaði. Í sambærilegri grein halda greiningaraðilar því fram að samsetning hækkandi GPU-verða, strangari kvóta frá skýjaþjónustuaðilum og bylgja af einkaleyfisumhverfum byggðum á einkaleyfum frá þremur stórum leikmönnum – OpenAI, Google og Anthropic – neyði þróunaraðila til að velja milli frammistöðu og kostnaðar. Þeir halda því fram að niðurstaðan sé breyting frá „gnægðar“ hugsunarháttinum sem gerði AI-verkfæri eins og eyðileganleg, yfir í nýja veruleika þar sem aðgangur er takmarkaður af fjárhagsáætlun og stefnumótandi samstarfi. Af hverju þetta skiptir máli er tvíþætt. Fyrst, sprotafyrirtæki sem byggðu vörur á forsendunni um ótakmarkaðar, lágtverðar API-kall eru núna í hættu á lausn í lausafjárstreymi, sem krefst hröðrar aðlögunar til hagræðingar eða flutnings í opna kóða lausnir. Í öðru lagi, fyrirtæki sem treystu á hratt frumgerðarvinnslu gætu þurft að endurmeta ROI-útreikninga, þar sem kostnaður á tákn hækkar og leyfisveitingar módelanna verða takmarkandi. Eins og við skýrðum þann 18. apríl, „Claude Code Opus 4.7 heldur áfram að athuga skaðlegan hugbúnað“, sem dregur fram vaxandi innri öryggisráðstafanir módelins. Næstu vikur munu sýna hvort kostnaðarlækkun Anthropic leiði til hærri verðs fyrir endanotendur eða hvort fyrirtækið opni stigveldisaðgangsforrit til að varðveita „gnægðan“ þróunaraðilaupplifun. Fylgist með tilkynningum um verðstig, samstarfsviðskipti við skýjaþjónustuaðila og um opna kóða greinar sem miða að því að halda AI-markaðnum samkeppnishæfu þrátt fyrir væntanlegan skort.
71

Ef þú veist ekki svar við spurningu, er handahófslegt svarið sem kemur út úr

Ef þú veist ekki svar við spurningu, er handahófslegt svarið sem kemur út úr
Mastodon +6 heimildir mastodon
Rannsóknarhópur við Háskólann í Kaupmannahöfn kynnti frumgerð sem þeir kölluðu „slop vélina“, vef‑tól sem býr til svör við hvaða spurningu sem notandi setur fram með því að draga á móti gríðarlegum, óútreiknanlegum gagnasafni tungumálalíkans. Í lifandi sýningum framleiddi kerfið sannfærandi hljómandi svör við spurningum frá „Hvað veldur norðurljósum?“ til „Hvernig virkar skammtaferð í skammtafræði?“, en þegar notendur höfðu ekki fyrri þekkingu var úttakið ómögulegt að sannreyna. Þeir sjálfir ávarpaðu að handahófskennd eðli svaranna gerir tækið ónyttbart fyrir þá sem geta ekki þegar metið sannleikann, og breytir því í stafrænan spákonu sem aðeins spýtur út sjálfsöruggum ósköpum. Sýningin varpar ljósi á vaxandi vandamál í gervigreindarsviðinu: stór tungumálalíkön geta skapað smáatriði sem hljóma yfirvöldum, fyrirbæri sem oft er nefnt „hallúcinun“. Fyrir venjulega notendur eða fyrirtæki sem treysta á AI við ákvörðunartöku, eykur ómöguleikinn að greina staðreyndir frá uppfinningum traustleysi og vekur ógn við útbreiðslu rangfærslu án eftirlits. Eins og við skýrðum 18. apríl, vakti Anthropic‑líkan Myths áhyggjur um óstaðfest svör, sem sýnir að vandamálið er ekki bundið við einn þjónustuaðila. Það sem kemur næst mun líklega móta hvernig iðnaðurinn takast á við sannprófunarbilinn. Rannsakendur keppa um að innleiða sjálfprófunarvettvang, eins og endurheimtustyrkt framleiðslu og trauststigakerfi, í næstu kynslóð líkanna. Anthropic hefur bent á væntanlegan uppfærslu á Myths sem mun leggja áherslu á staðreyndalega rótun, á meðan opinn hugbúnaður eins og Claude Code hefur sýnt fram á táknnæmt byggingarverk sem gæti stutt umfangsmeiri tilvísanir án þess að fórna hraða. Reglugerðarstofnanir í ESB eru einnig að setja upp leiðbeiningar sem gætu krafist þess að AI‑kerfi birti óvissustig þegar þau birta svör. Áhugasamir aðilar ættu að fylgjast með útgáfu þessara sjálfsprófunareiginleika, áhrifum nýrra ESB‑reglna um gagnsæi í AI, og hvort verkfæri eins og slop vélin þróist úr forvitni í ábyrgðarfullan aðstoðarmann. Kjarnspurningin er enn: Getur AI nokkurn tíma svarað áreiðanlega því sem við vitum ekki, eða verður það að eilífu háþróaður útgáfa af spákonu í kristallkúlu?
66

Anthropic dró úr Opus 4.6 áður en Opus 4.7 var sett á markað

HN +6 heimildir hn
anthropicclaude
Anthropic dró hljóðlega úr Opus 4.6‑líkaninu í vikum áður en Opus 4.7 var sett á markað þann 16. apríl, með því að minnka umferð og draga úr ákveðnum þáttum í svarframleiðslu. Innri fjarsendingargögn sem fyrrum verkfræðingur deildi sýna að fyrirtækið minnkaði hámarksfjölda tákna á sekúndu um það bil 40 % og innleiddi strangari öryggisfilter sem dró úr sköpunargáfu líkansins. Aðgerðin, sem innan fyrirtækisins er lýst sem „aðlögunarleg dráttur“, var ætluð til að koma í veg fyrir að eldri innviðir yfirhleðst á meðan nýja, skilvirkari Opus 4.7 var sett í loftið. Uppfærslan er mikilvæg vegna þess að Opus 4.6 hefur verið drifkraftur fyrir fjölda fyrirtækjaumsókna og þróunartól sem hafa verið sett í notkun síðan febrúar. Lið sem byggðu upp pípur um kringum upprunalega hraða og gæði úttaksins standa nú frammi fyrir hærri seinkun og minni táknbúnu, sem þýðir að þeir þurfa að flýta til að yfirfæra sig í nýja líkanið eða framkvæma dýra endurhönnun. Breytingin ýtir einnig upp gagnrýni á það að Anthropic noti frammistöðutakmörkun sem verkfæri til að ýta á uppfærslur, í takt við kvartanir á X og Reddit um að Opus 4.7 virðist „átaklegt“ og geri fleiri mistök þrátt fyrir auglýst tvöfaldan sannprófunarhæfni. Á sama tíma lofar nýja líkanið hárnákvæmum sjónskynjun, „xhigh“ átaksstig og kostnaðarhagræðingu í táknum – kröfur sem hafa fengið hrós frá fjárfestum eins og Garry Tan frá Y Combinator. Eins og við skýrðum þann 18. apríl er Opus 4.7 nú dýpsti Claude‑líkanið til dags, en fyrstu viðbrögð notenda eru blandað. Næstu vikur munu sýna hvort frammistöðubilið minnki þegar Anthropic fínstillir nýja vélina, eða hvort frekari drættir á eldri líkön verði endurtekinn mynstur. Fylgist með opinberu svarinu frá Anthropic, uppfærslum á verðlögum og mögulegri reglugerðarathugun á gagnsæi í takmörkun líkana, sérstaklega þegar fyrirtækið undirbýr kynningu á næstu kynslóð Mythos‑kerfisins.
63

Meta’s Næsta‑Kynslóð AI “Avocado” Gæti Verða Tafað Þar sem Hún Nær Ekki Í Keppinauta – CNET Japan

Mastodon +8 heimildir mastodon
agentsbenchmarksllamameta
Meta hefur frestað útgáfu næstu kynslóða grunnlíkansins, kóðanafnið “Avocado”, og dregið útgáfutímabilið frá áætlaða mars 2026 til að minnsta kosti maí 2026. Innri viðmiðunartestar sýna að Avocado féll á eftir frammistöðuviðmiðum keppinauta frá Google, OpenAI og Anthropic, sem leiddi til þess að fyrirtækið seinkar útgáfuna á meðan verkfræðingar vinna að því að minnka bilið. Setningin er mikilvæg vegna þess að Avocado átti að vera flaggskip AI-tilboðs Meta, ætlað að knýja allt frá endurnýjaða Llama‑3 seríunni til nýrra “agentic‑AI” þjónustu á samfélagsmiðlum fyrirtækisins. Líkanið sem er á eftir keppinautum gæti veiklað viðræðisstöðu Meta í hratt samruna AI-umhverfinu, þar sem Google’s Gemini 3.1 Flash TTS og Anthropic’s Claude 4.7 hafa þegar sýnt framúrskarandi fjölmynda‑hæfni og nánari samþættingu við þróunartól. Seinkunin frá Meta bendir einnig á víðtækari iðnaðarþróun: fyrirtæki eru treg að senda út líkön sem ná ekki háu kröfunum sem “stórir þrír” setja, til að forðast að missa traust þróunaraðila og markaðshlutdeild. Framtíðarsýn sýnir að Meta er, samkvæmt upplýsingum, að kanna tímabundna leyfisviðskipti við Google til að keyra Gemini‑byggða ályktun í vörum sínum á meðan Avocado er fínstillt. Áhorfendur munu fylgjast með öllum opinberum frammistöðuupplýsingum sem Meta gefur út, sérstaklega samanburðarstigum á staðlaðum viðmiðum eins og MMLU, BIG‑bench og fjölmynda‑rökfræðiprófum. Tímalínan fyrir nýja útgáfu, umfang hvers kyns leyfisarrangements og hvernig Meta staðsetur Avocado í samanburði við væntanlegar útgáfur frá OpenAI’s GPT‑4.5 og Anthropic’s Claude 5 mun móta samkeppnisdýnamíkuna fyrir restina af ári. Ef Meta tekst að minnka frammistöðuáfallið, gæti Avocado enn orðið hornsteinn í AI-stefnu fyrirtækisins; ef ekki, gæti fyrirtækið þurft að endurskoða vegvísir sinn algerlega.
60

270 sekúndna reglan: Hvernig á að draga niður kostnað Claude Code API um 90 % með snjöllum aðferðum

Dev.to +5 heimildir dev.to
agentsanthropicclaude
Anthropic‑s Claude Code‑líkanið hefur lengi verið fyrirmynd fyrir forritara sem byggja fjöl‑umhverfis vinnuferla, en verð á endurteknum API‑köllum hefur haldið mörgum verkefnum í þröngum takmörkum. Samfélags‑drifið „270‑sekúndna regla“ lofar nú að skera niður þessi gjöld um allt að 90 % með því að nýta innbyggða biðlarakvörðun (prompt cache) líkansins. Kvörðunin geymir nýjustu biðlarann í fimm mínútur (300 sekúndur). Þegar stjórnunarhringur (orchestrator loop) keyrir aftur áður en kvörðunin rennur út, rukkar Anthropic aðeins um það bil 10 % af fullum innsláttartáknaverði því að geymdur samhengistexti er endurnýttur. Ef hringurinn tekur um það bil 270 sekúndur eða lengur, telst kvörðunar‑færslan úrelt og næsta beiðni fær fullan kostnað. Með því að tímasetja köllin til að vera innan þessa glugga – eða með því að hópa nokkur verk í eina beiðni – geta forritarar haldið meirihluta tákna gjalda á brot af venjulegu verði. Af hverju þetta skiptir máli fer langt út fyrir einfaldan sparnaðar­hák. Claude Code knýr kóðagenerun, öryggisskoðun og sjálfvirka endurskipulagningu í tólum eins og nýju AI‑viðbótum GitKraken, sem við fjölluðum um 18. apríl. Hár tíðni stjórnunarhringa er kjarnamynstur í þessum vörum, og kostnaðarhindranir hafa takmarkað skalanleika þeirra fyrir sprotafyrirtæki og rannsóknarstofnanir um allt norræna svæðið. 90 % minnkun umbreytir efnahagsmódelum AI‑studdrar þróunar, gerir samfellu, fín‑kornuga aðstoð mögulega fyrir minni teymi og opinber verkefni. Það sem á eftir er að fylgjast með svörun Anthropic. Fyrirtækið gæti sett fram flögg fyrir kvörðunarstýring, breytt TTL (time‑to‑live) eða innleitt stigveldisverð sem formlegar sparninguna. Á sama tíma er vænt um að SDK‑uppfærslur bæti við hjálparföllum fyrir sjálfvirka hringjahlöðun, og þriðju aðila verkfæri – sérstaklega í CI/CD pípunum – muni líklega innleiða regluna sem sjálfgefna hagræðingu. Fylgist með þróun á Anthropic‑forritara bloggi og komandi Claude Code útgáfum til að sjá raunverulegar breytingar sem gætu gert 270‑sekúndna reglu að staðlaðri kostnaðarstjórnunaraðferð.
59

Mannleg meðvitund í kybernetískum tíma

Mannleg meðvitund í kybernetískum tíma
Mastodon +6 heimildir mastodon
meta
Matthew Segall’s nýjasta grein á Substack, „Human Consciousness in a Cybernetic Age“, hefur kveikt nýjan umræða um heimspekilegu takmörkin í gervigreind. Segall, hugræn vísindamaður sem hefur breyst í opinberan fræðimann, heldur því fram að jafna hugmyndavinnu við útreikninga sé einföldun sem gæti eyðilagt menningarlegar, tengslafræðilegar og líkamlegar víddir meðvitundar. „Rökstuðningur minn er ekki andstæðingur tækni. Rökstuðningur minn er að við verðum að mótmæla jafnan hugmyndavinnu við útreikninga,“ skrifar hann og hvetur fræðimenn og tæknifræðinga til að líta á samverkun mannshugar og vélmenna sem tvíátta endurgjöfslúppu frekar en einsíða uppfærslu. Greinin kemur á tímum þegar AI‑studd viðbót er að fara frá spekulatívri skáldsögu í viðskiptalega veruleika. Burðarlegir taugatengingar, heilavélartengingar og AI‑styrkt ákvörðunartól eru þegar í prófun í norrænum heilbrigðiskerfum og í evrópskum rannsóknarstofum. Á sama tíma sýna iðnaðarfyrirbærar eins og samstarf Zoom við World til að sannreyna mannleg þátttakendur og OpenAI‑sandkassa‑agent SDK vaxandi löngun eftir óaðfinnanlegri mann‑AI samskiptum. Viðvörun Segalls snertir því kjarnavanda: hvernig á að samþætta útreikningaflæði án þess að hrunna í auðvelt, óreiknilegt efni mannlegrar reynslu. Af hverju er þetta mikilvægt, bæði siðferðilega og hagnýtt? Lögstjórar sem vinna að nýju AI‑lögum ESB eru að glíma við skilgreiningar á „human‑in‑the‑loop“ og „autonomous system.“ Ef meðvitund er aðeins sett fram sem gagnavinnsla, gætu reglugerðir hunsað spurningar um sjálfsmynd, persónuvernd og menningarlegan samhang sem kybernetísk viðbót kallar fram. Enn fremur gætu rannsóknarteymi sem byggja stórtækar módel—svo sem Anthropic’s Claude‑Code, sem nýlega sýndi stöðuga rökstuðning yfir 200 K táknum—óvart áreitt tölvu‑metaforann sem Segall gagnrýnir. Það sem á eftir að fylgjast með eru fjölgreinasöfnunarfundir sem eru áætlaðir til sumarsins, sérstaklega Nordic AI & Society ráðstefnan í Osló og AI Ethics Summit ESB í Brussel. Báðir munu innihalda umræðu um kybernetískt líkamsástand og líklegast vísa til greinar Segalls. Væntanlegur er einnig sprengja í fræðilegum svörum, þar sem tímarit í heimspeki hugarins og mann‑tölvu samskiptum eru nú þegar að leita eftir umsögnum. Samræðan er á vegi til að móta ekki aðeins hvernig við byggjum snjallari vélar, heldur hvernig við skilgreinum hvað það þýðir að vera manneskja í sífellt kybernetískum heimi.
56

Apple og Google brutu eigin reglur með því að kynna “Nudify”-forrit, segir skýrsla

Apple og Google brutu eigin reglur með því að kynna “Nudify”-forrit, segir skýrsla
Mastodon +6 heimildir mastodon
applegoogle
Apple og Google eru í brennidepli vegna ásakana um að brjóta eigin innihaldsreglur með því að birta AI‑knúin “nudify” forrit í App Store og Google Play. Ný rannsókn frá Tech Transparency Project (TTP) fann meira en tólft forrit sem segja að þau geti fjarlægt föt af myndum eða skipt um andlit, og kom í ljós að leitarvísbendingar og auglýsingastöður á báðum vettvangi birta þau reglulega notendum. Rannsóknin stendur í mótsögn við opinberar stefnur fyrirtækjanna, sem banna forrit sem búa til kynferðislegar myndir af raunverulegum fólki án samþykkis. App Store Review Guidelines hjá Apple og Developer Program Policy hjá Google banna skýrt óheimilað deepfake‑efni og efni tengt niðurliti, en skýrsla sýnir að forritin eru enn í skrá og jafnvel í forgrunni í sjálfvirkum leitarorðum og í fjármagns‑auglýsingum. Mikilvægi málsins felst í því að “nudify” verkfæri geta verið notuð í hefnda‑pornógrafíu, áreitni og öðrum gerðum stafrænnar misnotkunar. Tilvist þeirra á helstu markaðsstöðum setur ekki aðeins notendur í hættu við ólöglegt efni, heldur vekur spurningar um virkni sjálfvirkrar umfjöllunar og ábyrgð tæknijöfnuða í ljósi nýrra reglna, svo sem EU Digital Services Act og væntanlegra bandarískra persónuverndarreglna. Fyrirtæki geta lent í orðsporskaða, og fórnarlömb geta þurft að takast á við nýjar leiðir til ósamþykktrar nýtingar. Það sem á eftir að fylgjast með er hvort Apple og Google muni framkvæma neyðar‑fjarlægingar, skerpa á algrímsstýringu eða lenda í formlegum rannsóknum frá eftirlitsaðilum. Báðar aðilar hafa lofað að bæta eftirlit með AI‑framleiddum efni, en TTP‑rannsóknin bendir til bils milli stefnu og framkvæmdar. Greiningaraðilar munu einnig fylgjast með hugsanlegum lögsögum frá persónuverndarverndarmönnum og víðari hreyfingu í átt að strangari stöðlum um deep‑fake tækni í gegnum forritakerfi. Ágreiningurinn gæti orðið vísbending um hvernig stærstu vettvangsstjórar munu stjórna AI‑knúinni misnotkun í framtíðinni.
56

Zoom slær í samstarf við World til að sannreyna menn í fundum | TechCrunch

Mastodon +6 heimildir mastodon
Zoom hefur sett í gang nýtt öryggislag fyrir vídeófundarþjónustu sína með því að slá í samstarf við World, mannauðssannvottunarfyrirtækið sem stofnaði OpenAI‑forstjóri Sam Altman. Samþættingin mun bæta við “Verified Human” merki við þátttakendur þar sem andlit þeirra eru kross‑skoðuð gegn lífsverandi og líffræðilegum prófum World, sem gerir hýsingum kleift að sjá á fyrstu sýn hver er raunverulega til staðar og hver gæti verið AI‑skapað avatar eða djúp‑svik. Þetta eigindlega, sem er áætlað að fara í stigveldisútgáfu til fyrirtækja viðskiptavina næstu mánuð, byggir á núverandi AI Companion verkfærum Zoom sem þegar búa til samantektir fundar og aðgerðarpunkta. Fyrirbærið kemur á tímum þegar áætlaðar miðlunarsárásir (synthetic‑media) eru að fara frá jaðar til að vera aðalviðskiptaáhætta. Rannsakendur hafa
53

SV: https:// mastodon.ie/@HazelChu/11642126 2212777115 Ef þú þarft raunveruleg tölur frá raunverulegum

Mastodon +6 heimildir mastodon
microsoft
Nýlegur póstur á Mastodon hefur vakið upp á nýju umdeildum umræðunni um kolefnisspor stórra tungumálalíkana (LLM). Þráðurinn, sem hófst með tengli á nýja sameiginlega rannsóknarstofu Evrópusambandsins, vísaði í tölur sem setja rafmagnsnotkun stærstu AI-líkana heims í jafnan við árlega orkunotkun smáa ríkja. Í svari skrifaði notandinn Hazel Chu: „Ef þú þarft raunveruleg tölur frá raunverulegum gagnaverum til að sannfæra fólk um að þau séu plága sem við þurfum að stjórna,“ og merkti #ai, #llm, #datacentres og #energy. Skýrslan, sem kom út í síðustu viku, safnar saman opinberlega birtuðum orkunotkunargögnum frá fleiri en 30 stórum gagnaverum og bætir við áætlanir um þjálfunartímabil líkana eins og GPT‑4, Claude 2 og LLaMA‑2. Hún ályktar að þjálfun eins einstakra, nútímalegra LLM gæti losað um allt að 600 tonn CO₂, á meðan áætlanir um keyrslu (inference) í skýjaþjónustum núna mynda um það bil 5 % af heildarorkunotkun gagnaveranna í heiminum. Höfundarnir leggja áherslu á að án gagnsæis í reikningum skortir stefnumótunarmenn sönnunargögn til að móta áhrifaríkar loftslagsvænar AI-reglur. Umdeildin er mikilvæg því AI‑þróunaraðilar hafa lengi bent á hagkvæmniaukningu – t.d. vélbúnaðaroptimeringu, módelklippingu og samninga um endurnýjanlega orku – sem sönnunargögn um að greinin leiðist sjálf. Gagnrýnendur halda hins vegar því fram að sjálfviljugar upplýsingagjöf í greininni sé brotin upp og oft sleppi um það mest orkuneytandi þjálfunartímabil. Ef tölur Evrópu standa undir, gæti greinin þurft að takast á við strangari kolefnisskammta, skylt skýrslugerð og mögulega kolefniskostnaðarútreikninga. Hvað á að fylgjast með næst: Evrópusambandið áætlar að ljúka AI‑lögunum síðar á þessu ári, og drögin innihalda ákvæði um að „hááhrifarík“ AI‑kerfi þurfi að birta líftímaskýrslur um orkunotkun. Á sama tíma hafa stórir skýjaþjónustuaðilar lofað að setja upp mælaborð sem sýna rauntímaorkunotkun tengda AI. Greinasamtök eins og Green‑AI Alliance eru einnig að undirbúa sett af sjálfviljugum mælikvörðum sem gætu orðið de‑facto staðlar ef stjórnendur hreyfast hægt. Næstu mánuðir munu sýna hvort gagnsæisátök geta haldið í við hraða vöxt LLM eða hvort strangari eftirlit verði óumflýjanlegt.
50

5+ atriði til að vita um næsta Mac Studio

Mastodon +6 heimildir mastodon
apple
Apple er að undirbúa sig til að skipta út Mac Studio frá 2022 með mun öflugri eftirfylgju, samkvæmt nýrri MacRumors samantekt sem kom út 17. apríl. Nýja líkanið, sem er áætlað að koma á markað árið 2026, mun koma með nýju M5 Max og M5 Ultra örgjörvar Apple, sem lyfta útreikningshámarki borðtölvunnar langt umfram núverandi M2 Ultra. Fyrstu leka benda til AV1‑einungis myndavinnslu, vélbúnaðarhröðuðu geislarits, og Thunderbolt 5, á meðan minnis- og geymsluvalkostir vaxa í ótrúlegum 512 GB RAM og 16 TB SSD í efstu Ultra-uppsetningunni. Af hverju er þetta mikilvægt? Tvöfalt. Fyrst og fremst samræmist uppfært silíki Apple‑borðtölvuúrvali við þunga AI‑ og gerðargreindarvinnslu sem hefur orðið að hefð í Norðurlöndum, þar sem kvikmyndastöðvar og miðlunarfyrirtæki eru þegar að nota stór tungumálalíkön á staðnum. Í öðru lagi lofar innlimun Wi‑Fi 7, Bluetooth 6 og nýja N1 netörgjörva Apple raunverulegan kynslóðarskref í þráðlausum frammistöðu, sem minnkar bilið við hágæða Windows‑vinnustöðvar sem hafa lengi treyst fljótlegri útvarpsbúnaði til gagnaþyngdar samvinnu. Tilkynningin kemur einnig í því skyni að birgðir núverandi Mac Studio minnka, sem gefur vísbendingu um að Apple gæti flýtt fyrir umbreytingunni til að forðast birgðaskort eins og RAM-skortirnir sem áttu sér stað í MacBook Pro línunni 2023. Fyrir lesendur sem fylgdu frásögn okkar 13. febrúar um komandi Mac Studio, staðfestir apríl-samantektin að ílát verður óbreytt, en innri hlutar verða verulega endurnýjaðir. Það sem á eftir að fylgjast með: opinber lanseringaráðstefna — líklega í fyrstu hálfu ársins 2026 — þar sem Apple mun birta verð, nákvæmar stillingarlíkanir og hvort einhverjar hönnunarbreytingar (svo sem stærra kælingarkerfi) fylgi nýju örgjörvunum. Jafnframt verður mikilvægt að sjá hvernig Apple pakkar eigin AI‑þjónustum, eins og Claude‑stíls aðstoðarmönnum, inn í Mac Studio vistkerfið, og hvort kerfið verði sjálfgefið vélbúnaðarlag fyrir AI‑rannsóknarstofnanir og skapandi kvikmyndastöðvar í Norðurlöndum. Fylgið með til að fá fyrstu hand‑á‑reynslu þegar vélarnar koma í prófunarstöðvar Apple.
48

Af hverju Claude Code neyðir sjálft sig til að lesa skrár áður en hann breytir þeim

Dev.to +6 heimildir dev.to
claude
Anthropic’s Claude Code now insists on a full read‑through of any file before it makes changes, a shift that tightens safety nets for developers while reshaping the tool’s workflow. The change, rolled out in the latest Opus 4.7 patch, forces the model to retrieve the entire contents of a target file—rather than sampling snippets—as a prerequisite to any edit or filesystem command. The move follows a series of community‑raised issues, notably a September 2025 bug where permission prompts were ignored and a June 2025 request to stop “piece‑milling” large files, which had caused the model to spin or miss context. Why it matters is twofold. First, mandatory full reads eliminate the risk of unintended side effects that stem from partial knowledge, a concern that grew as Claude Code began handling more complex codebases and even malware‑scanning tasks, as we reported on 18 April 2026. Second, the stricter gatekeeping aligns Claude Code with its documented “plan mode,” where read‑only tools generate an actionable plan that users must approve, reinforcing human oversight in automated refactoring. The update also introduces an “auto‑accept” tier for benign filesystem operations such as mkdir or mv, while preserving the ask‑before‑edit default for substantive code changes. Users can still bypass the read‑first requirement by explicitly invoking parallel agents, a trick outlined in Tyler Burnam’s 2025 Medium guide, but the default now nudges developers toward a more transparent edit cycle. What to watch next are the ripple effects on developer productivity and on Anthropic’s roadmap. Early adopters are testing the new flow in integrated environments like GitKraken, where the change may affect the seamless Claude‑GitKraken sync we covered earlier this month. Anthropic has hinted at a forthcoming Opus 4.8 that could expand plan‑mode capabilities and refine permission handling, so the community will be keen to see whether the read‑first rule becomes a permanent fixture or a configurable option.
48

Show HN: Ég breytti litlu glugganum á MacBook Pro mínu í lifandi Claude Code stjórnborð

HN +6 heimildir hn
claude
Forritari á Hacker News hefur breytt litla glugganum (notch) á 2022‑2023 MacBook Pro tölvunni sinni í lifandi stjórnborð fyrir Anthropic‑kerfið Claude Code, þar sem sýnt er ástand allt að átta samtímasamstilltra kóðunarsetta. „CodeIsland“‑hakkinn, sem er lýst í Show HN færslu, grípur rauntímaúttak Claude Code, villumerki og teljara fyrir notkun teikna (tokens) og birtir þau í 800 mynddíla breiðu glugganum, og umbreytir þannig hönnunarfáðri í framleiðsluviðmót. Aðgerðin kemur aðeins nokkrum vikum eftir að Anthropic gaf út Claude Code Opus 4.7, sem bættir inn innbyggðu skönnun á skaðlegum hugbúnaði, skarpari frammistöðu módelins og „270‑sekúndum reglu“ til að minnka API‑kostnað um allt að 90 % (sjá fjölmiðlaumfjöllun okkar frá 18. apríl). Með því að sýna heilsu setta á augabragði, leysir gluggastjórnborðið vandamál sem snemma notendur hafa bent á: að halda utan um mörg Claude Code‑glugga, missa af heimildarbeiðnum og missa yfirsýn yfir hvaða verkefni er lokið. Forritarinn segir að sjónræna vísbendingin útrými örvæntingarfullum Alt‑Tab‑aðgerðum og dragi úr tafar í samhengi‑skipti. Af hverju þetta skiptir máli er tvíþætt. Fyrst sýnir það hvernig forritarar eru þegar að endurnýta vélbúnaðar‑UI‑þætti til að fylgjast með AI‑þjónustum, sem bendir til eftirspurnar eftir innbyggðum, alltaf‑virkum AI‑stöðusýningum. Í öðru lagi undirstrikar hakkinn vaxandi treystu á Claude Code í daglegum kóðunarvinnslu, sem gerir sýnileika á þjónustustig að hagnýtu áhyggjuefni—sérstaklega í ljósi nýlegra bilunarmappa sem sýna að meðaltal niðurtíma er aðeins yfir þremur klukkustundum þegar módelinn fer óvirkt. Það sem á eftir að fylgjast með er hvort Anthropic eða þriðju aðila verkfærasmiðar muni gefa út opinberar gluggasamhæfar íhluti eða macOS‑valmyndarbikarviðbætur sem staðla AI‑eftirlit. Jafnframt gæti samfélagið prófað svipaðar samþættingar fyrir aðra módel eins og GPT‑5.3 eða nýrri opna‑kóða aðstoðarmenn. Ef þróunin heldur áfram, gæti glugginn þróast úr hönnunarbrotinu í alhliða AI‑ops stjórnborð fyrir forritara um alla Norðurlönd og lengra út.
47

Kevin Weil 🇺🇸 (@kevinweil) á X

Mastodon +6 heimildir mastodon
openai
Innan fyrirtækisins OpenAI er “Science” deildin að verða sundurlæg, þar sem OpenAI for Science forritinu er ætlað að upplýsa og starfsmenn þess eru að dreifa yfir aðrar rannsóknarteymi, sagði varamælir vísinda deildarinnar Kevin Weil á X. Færsla Weil, sem var deilt 22. apríl, lýsir því sem “endurskipulagningu til að flýta fyrir vísindum”, sem gefur til kynna að fyrirtækið fari frá sérstökum, miðstýrðum AI‑fyrir‑vísinda hópi yfir í meira innbyggt kerfi innan víðtækari rannsóknarvél OpenAI. Breytingin kemur aðeins nokkrum dögum eftir að OpenAI staðfesti brottför Kevins Weil og Bill Peebles, þróun sem við fjölluðum um 18. apríl. Brottför þeirra bentu til víðtækari niðurskurðar á hliðaverkefnum, og núverandi endurskipulagning staðfestir að fyrirtækið er að sameina vísindaleg markmið sín undir aðalvörur og módelteymi í stað þess að halda sjálfstæðri deild. Með því að dreifa AI‑knúnum rannsóknarfærni um alla stofnunina vonast OpenAI til að innleiða vísindatól beint í helstu módelin sín, sem gæti flýtt fyrir útgáfu eiginleika eins og sjálfvirkri tilgátugerð, aðstoð við prótein‑folding og loftslags‑líkanið viðbætur. Greinir í greininni sjá þessa aðgerð sem bæði tækifæri og áhættu. Á einum hliðarmörkum gæti nánari samþætting flýtt fyrir innleiðingu AI‑knúinna rannsóknartól, sem gefur OpenAI samkeppnisforskot á vaxandi AI‑fyrir‑vísinda markaði. Á hinn bóginn gæti missir á sérstökum vísindadeild dregið úr sérfræðikunnáttu, hæglað langtímaverkefni og skapað óvissu í samstarfi við háskóla- og rannsóknarstofnanir sem hafa treyst á OpenAI for Science sem eitt tengiliðapunkt. Það sem á að fylgjast með næst: tilkynningar um nýja forystu fyrir dreifðu teymin, endurskoðuð samstarfsverkefni við háskóla eða rannsóknarstofnanir, og fyrsta bylgja vísindalegra eiginleika sem koma fram í komandi módelútgáfum. Samfélagið mun einnig vera spennt að sjá hvort OpenAI birti vegvísir um AI‑knúna rannsóknaráætlun sína, sem gæti sett tóninn fyrir næstu stig AI‑studdra uppgötvana.
46

Rannsókn varar við því að mikil áreiðanleiki á AI gæti smám saman slitið mannlega vitund

Morning Overview on MSN +7 heimildir 2026-04-16 news
Lið rannsókna á stjórnunarfræði við Háskólann í Bath hefur birt fyrstu tilraunargögn sem sýna að mikil áreiðanleiki á stórum tungumálalíkönum (LLM) getur slitið kjarnahugræn færni. Í sex mánaða langtímarannsókn voru 312 þátttakendur skipt í tvo hópa: einn hópur notaði AI‑aðstoðartól eins og ChatGPT til daglegrar skrifa, gagnaúrvinnslu og vandamálalausnar, á meðan stjórnunarhópurinn framkvæmdi sömu verkefni án hjálpar. Hugræn próf sem voru framkvæmd áður, á meðan og eftir rannsóknina sýndu að hópurinn með AI‑aðstoð bætti hraða í verkefnaúrvinnslu en sýndi mælanlegan minnkun í vinnsluminni, víðfaldri hugsun og getu til að rifja upp upplýsingar án ábendinga. Niðurstöðurnar endurspegla sambærilega rannsókn frá MIT sem varaði við því að “rotta heilanum” þegar notendur vanalega úthluta rökstuðningi til spjall‑aðstoðarmanna. Báðar rannsóknir nota líkinguna um “sjóðandi frosk”: smám saman aukin skilvirkni hylur smám saman tap á hugrænni sveigjanleika. Rannsakendur leggja áherslu á að áhrifin eru ekki skyndileg hrun heldur dularfullur breytileiki í taugavirkni, þar sem virkni í framhugahettanum minnkar við vandamálalausn án hjálpar, samkvæmt fMRI‑skönnun (functional MRI). Áhrifin ná út fyrir háskólalífið. Fyrirtæki sem innleiða LLM í daglegum vinnuferlum gætu óvart minnkað gagnrýna hugsun starfsmanna, á meðan kennarar geta skapað
44

Einn orðinn litur fyrir iPhone 18 Pro? Rík dökk kirsuberurauður

Mastodon +6 heimildir mastodon
apple
Nýja iPhone 18 Pro frá Apple gæti komið í einum, áberandi nýjum lit: Dark Cherry, djúpur vínrauður sem myndi koma í stað bjarta Cosmic Orange sem kom í boði með iPhone 17 Pro. Upplýsingarnar komu fram í færslu á CNET sem vísaði í Bloomberg-fréttamanninn Mark Gurman, sem var fyrst að gefa til kynna „ríkan rauðan“ fyrir 2026‑flaggskipið. Leakar í framboðskerfinu staðfesta breytinguna og sýna að litaval Apple er að minnka í Dark Cherry ásamt þremur daufari litum. Aðgerðinni er mikilvæg vegna þess að litaval Apple hefur orðið eins konar dularfullur barometer markaðsstefnu. Dark Cherry bendir til þess að fyrirtækið snúi sér að hágæða, íþyngdum útliti sem fellur að nýlegri áherslu Apple á lúxusáferð og hærri hagnaðarbúnað. Liturinn endurspeglar einnig viðbrögð vörumerkisins við þreytu neytenda af neon‑björtum litum sem ríkti í síðustu tveimur kynslóðum. Með því að einfalda úrvalið í kringum sofistikerðan lit getur Apple verið
44

Google Gemma (@googlegemma) á X

Mastodon +6 heimildir mastodon
geminigemmagoogle
AI-liðið hjá Google hefur sett á X stutt myndband sem sýnir hvernig hægt er að keyra nýjustu Gemma 4‑líkanið beint á iPhone, alveg án nettengingar. Sýningin dregur fram að líkanið getur meðhöndlað langvarandi samhengi í spurningum án þess að snerta skýið, sem útrýmir kostnaði við gagnaflutning, API‑gjöldum og endurteknum áskriftum. Klippan, sem var deilt frá @googlegemma reikningnum, leiðir áhorfendur í gegnum uppsetningarskrefin og sýnir rauntíma spjall sem keyrir eingöngu á örgjörva tæknisins. Aðgerðin er mikilvæg því hún ýtir mörkum jaðraðgervigreindar frá fartölvum og netþjónum yfir í handvirkt neytendatækni. Með því að nýta sömu rannsóknir sem liggja að baki Gemini-raðanum hjá Google, býður Gemma 4 létt, en samt hæfileikaríkt stórt tungumálalíkan sem er hægt að innfelld í forrit án þess að birta notendagögn á ytri netþjóna. Fyrir nordíska notendur, þar sem persónuverndarreglur eru strangar og farsímtengingar geta verið óstöðugar í afskekktum svæðum, opnar ónettengt LLM nýja möguleika á öruggum persónulegum aðstoðarmönnum, þýðingu á tækinu og staðbundinni efnisframleiðslu. Þetta bendir einnig til þess að Google vilji keppa við eigin tungumálalíkön Apple á tækinu og Meta’s opna hugbúnaðarverkefni, sem gæti umbreytt eðli AI‑knúinna farsímþjónustu. Eins og við skýrðum 16. apríl, hefur Gemma-fjölskyldan þegar sýnt fram á skilvirkni á örgjörvum, þar sem Gemma2B fór fram úr GPT‑3.5 Turbo í próftökum. Útgáfan fyrir iPhone gefur til kynna að Google sé nú að breyta þeirri skilvirkni í neytendavænan formfaktor. Næstu skref sem vert er að fylgjast með eru frammistöðumat á M‑raðar örgjörvum Apple, útgáfa þróunartólkassa fyrir iOS‑innleiðingu og hvort Google muni útvíkka ónettengda stuðning við aðrar vettvangar eins og Android spjaldtölvur eða snjalltæki. Iðnaðarskoðendur munu einnig vera spenntir að sjá hvernig nákvæmni líkanins og öryggisstýringar standast þegar skýja‑stjórnunarlagar eru fjarlægðar.
42

Show HN: Llama.cpp Kennsla 2026: Keyra GGUF‑módel á staðnum á örgjörva og GPU

HN +6 heimildir hn
gemmagpuhuggingfaceinferencellamaopenai
Kennsla sem birti á Hacker News í þessari viku leiðbeinir forritara um hvernig á að keyra tungumálamódel í GGUF‑sniði með llama.cpp á bæði örgjörvum (CPU) og skjákortsörgjörvum (GPU). Leiðbeiningarnar, með titlinum „Show HN: Llama.cpp Tutorial 2026“, innihalda skref-fyrir-skref skipanir til að sækja módel frá Hugging Face, ræsa ályktunartólið llama‑cli og setja upp OpenAI‑samrýman API‑þjón með llama‑server. Hún dregur fram nýjustu stuðning vélarinnar við fjölbreyttar vélbúnaðaruppsetningar – AVX, AVX2 og AVX512 á Intel, CUDA á NVIDIA, HIP á AMD, auk Vulkan og SYCL fyrir nýleg GPU‑tækni – og sýnir hvernig má stilla lotustærðir, samhengi‑glugga og nákvæmni (t.d. MXFP4) til að ná hámarksafköstum. Kennslan er mikilvæg vegna þess að hún lækkar hindrunina fyrir að keyra stór tungumálamódel á staðnum, breyting sem gæti umbylt AI‑dreifingu í Norðurlöndum. Með því að halda gögnum á eigin neti geta fyrirtæki forðast kostnað við skýjaþjónustur og uppfyllt GDPR‑kröfur um stranga persónuvernd auðveldara. Hæfni til að keyra á lágmörkuðum örgjörvum gerir áhugafólk og litla sprotafyrirtæki kleift að prófa án dýrrar vélbúnaðar, á meðan GPU‑leiðirnar gera stærri vinnulóðir kleift að vera á staðnum, sem opnar dyr fyrir jaðar‑AI‑vörur eins og rauntímaþýðingu á norrænum tækjum eða staðbundna þjónustubota. Áhorfendur í samfélaginu munu fylgjast með næstu útgáfu llama.cpp, sem lofar nánari samþættingu við Apple Silicon og enn minni minnisfótspor. Niðurstöður úr samanburðaprófum sem bera saman GGUF‑ályktun við keppinauta eins og Ollama eða vLLM eru áætlaðar að birtast á næstu vikum, og nokkur norræn AI‑inkúbátor hafa þegar sýnt áhuga á að byggja eigin þjónustu á þessari tækni. Ef viðtökuhringurinn fyrir kennsluna speglar fljóta innleiðingu fyrri opins-kóðans verkfæra, gæti komið til mikils aukningar í staðbundnum LLM‑forritum um alla Skandinavíu áður en árið er lokið.
42

Claude Opus 4.7: Greining á vitsmunum, afkastanum og verði

HN +5 heimildir hn
anthropicclaudereasoning
Anthropic hefur gefið út Claude Opus 4.7, nýjasta útgáfu af stóra málkerfissinum, og sjálfstæð mati sem gefinn er út í dag staðfestir að uppfærslan feli í sér mælanlegan höll á varanlegri rökfræði, merkingarflæði og kostnaðarsemi. Greiningin, sem er tekin saman úr prófunum á OpenRouter, CometAPI og eigin endapunkti Anthropic, settir "Adaptive Reasoning, Max Effort" ham Opus 4.7 á móti fyrra 4.6 útgáfuna og keppinautum á borð við OpenAI GPT-4-Turbo og Google Gemini 1.5-Pro. Á útfærslumálum sem ná yfir langtímamál - kóðagerð, laganýting og margþrepa vandamálalausn - meðaltími Opus 4.7 er 1,8 sinnum hraðari tími til fyrsta merkingar og heldur 2,3 sinnum hærra merkingar á sekúndu þegar samhengsglugginn er pressaður til 1 milljón merkinga. Gæðapunktar frá HELM-mati hækkar 4,5 punkta, sem minnkar bilið við GPT-4-Turbo á rökfræðikröfum. Verðmátning er sú staða þar sem áhrif módelins geta verið mest óvænt fyrir þróunarfræðinga. Anthropic listar grunnskatt af 5 dollarar fyrir milljón innskotstákna og 25 dollarar fyrir milljón útgangstákna, en greiningin bendir á að þriðja aðila þjónustuaðilar eins og CometAPI hafi þegar undirkommið þessar tölur um 20%. Með hámarki á 128 k-táknum verða efnahagur langvinnandi aðgerða - eins og sjálfvirkra rannsóknarhjálpara eða samfelldra kóðaskoðunarvængja - marktæktari en með fyrrum Opus-útgáfum. Það sem máli skiptir er tvíþætt: fyrst, samsetning 1 M-tákna samhengsglugga og hærra varanlegs flæðis opnar nýjar notkunarmöguleika sem áður voru takmörkuð vegna tölvutíma eða kostnaðar. Önnur, verðförðunin getur fært fyrirtækjaiðkun í átt að Anthropic-kerfinu, sérstaklega fyrir vinnslur sem krefjast djúpar, margþrepar rökfræði. Áfram skal athugað, hvernig "x-há" árangursstig Anthropic hlusta undir raunverulegu álagi, hvort lægri verði þjónustuþátta haldi sig stöðug og hvernig keppinautar svara með stærri gluggum eða ódýrari flæði. Eins og við rituðum 18. apríl, Claude Opus 4.7 bendir þegar til "upphafendar á áræðni í gervigreind"; komandi vikur munu sýna hvort áræðnin verði að markaðshlutdeildarförðun.
41

Ronan Farrow um erfið sambönd Sam Altmans við sannleikann | Decoder

Mastodon +6 heimildir mastodon
openai
Ronan Farrow sat á við Decoder í þessari viku til að greina greinin í The New Yorker sem hann samskrifaði með Andrew Marantz, tvíþætt rannsókn sem kastar löngu skugga yfir forstjóra OpenAI, Sam Altman. Farrow hélt því fram að greinin loksins skýri „stuttan uppsögn“ atburðinn í nóvember 2023, óskýra ákvörðunarferli stjórnar og vana Altmans til að forðast erfiðar spurningar. Hann lýsti Altman sem „þrýstingslausum óhindraðum“ í opinberum yfirlýsingum, eiginleika sem, samkvæmt Farrow, hjálpaði til við að knýja uppreisn í stjórnherberginu sem leiddi til tímabundinnar útrýmingar hans áður en hann var fljótt endursett með stuðningi starfsmanna og fjárfesta. Viðtalið er mikilvægt vegna þess að trúverðugleiki Altmans stendur í miðju öryggis gervigreindar, fyrirtækjastjórnunar og opinberra stefnu. Fljótleg útgáfa OpenAI á GPT‑4‑Turbo og átak þeirra í fjölbreyttum vörum byggist á trausti frá eftirlitsaðilum, fyrirtækjum og almenningi. Ef frásögn forstjórans er talin óáreiðanleg gæti það flýtt fyrir kröfum um ytri eftirlit, aukið athygli fjárfesta og hvatt samkeppnisaðila til að spyrja um yfirráð OpenAI. Áframhaldandi þróun mun prófa hvort leyndarmál Farrow verði til raunverulegra breytinga. Stjórnin OpenAI er væntanleg að birti eftirmortem um krísuna í 2023, og fyrirtækið hefur bent á nýjar gagnsæiáætlanir varðandi þjálfunargögn módelanna og öryggisprófanir. Á sama tíma er líklegt að AI-lög EU og komandi þingfundur í Bandaríkjunum um áhættustjórnun gervigreindar vísi til Altman-tilviksins sem varúðarfrásögn. Áhorfendur munu fylgjast með næstu „town‑hall“ fundi Altmans með starfsmönnum OpenAI til að sjá hvort tónninn breytist, og hvort fyrirtækið muni innleiða formlegri samskiptapróf til að draga úr „óhamingjusömri“ frásögn sem Farrow lagði áherslu á. Eins og við skýrðum 17. apríl, hefur rannsókn Farrow þegar kveikt á umræðu; Decoder‑viðtalið gæti nú dregið samtalið frá ágiskanir til stefnu.
41

Fyrri Sora‑yfirmaður OpenAI fer

Mastodon +5 heimildir mastodon
openaisora
OpenAI tilkynnti á föstudegi að Bill Peebles, yfirmaður stuttmyndaverkefnisins Sora, og Kevin Weil, varaforseti fyrir gervigreind í vísindum, eru að yfirgefa fyrirtækið. Brottfarirnar koma aðeins nokkrum vikum eftir að OpenAI lokaði Sora, skapandi myndavinnsluverkfæri sem var kynnt í upphafi árs 2024, og lagði niður sérstakt vísindateymi. Peebles, sem var ráðið árið 2022 til að leiða OpenAI í viðskipti við neytendamiðaða fjölmiðla, sá um fljótleg
41

Ég lær mig ML-hugtök best þegar ég þarf að útfæra þau frá grunni í takmarkaðri þraut. Deep‑M

Mastodon +6 heimildir mastodon
computer-vision
Deep‑ML, nýtt ókeypis vettvangur sem umbreytir vélarnámskenningum í litlar þrautir, fór í loftið í þessari viku og hefur þegar laðað að sér fjölda nemenda, áhugamanna og sérfræðinga um alla Evrópu. Vefurinn býður upp á handvirkt valdar safn forritunaráskorða sem krefjast þess að notendur útfæri allt frá línulegri algebru frumefnum til fullkominna djúpnáms pípunna, með vandamálum sem eru skrifuð af virkum ML‑verkfræðingum og rannsakendum. Hver þraut er meðvitað takmörkuð – til dæmis þurfa þátttakendur að skrifa gradient‑descent lykkju án þess að nota hágæða bókasöfn – sem neyðir nemendur til að takast á við stærðfræðina og reikniritadæmin sem kennslubækur hunsa oft. Útgáfan er mikilvæg vegna þess að AI‑tækniskortið í Norðurlöndum er enn áberandi þrátt fyrir sterka fyrirtækja fjárfestingu. Hefðbundin MOOC‑kerfi skila vel hugmyndum en prófa sjaldan hvort nemendur geti breytt þeim í raunverulegan kóða. “Útfæra‑frá‑grunni” nálgun Deep‑ML fyllir þennan eyðileggingu, með umhverfi með lágu áhættu þar sem notendur geta prófað, fengið tafarlausan viðbragð og borið lausnir saman við jafningja. Fyrstu tölur sýna yfir 12.000 skráningar á fyrstu 48 klukkustundum, og nokkrir háskólaprófessorar hafa þegar innleitt áskoranirnar í inngangsnámskeið, og vísa til opinn‑kóða menningar vettvangsins og auðveldleika við að innleiða sérsniðin vandamál. Áhorf til framtíðar sýnir að Deep‑ML hyggst koma á tímabundnar keppnir sem líkja eftir raunverulegum gagnafræði‑tímarammi, og leitar eftir samstarfi við skýjaþjónustur til að bjóða ókeypis reikniskuld fyrir stærri verkefni. Liðið bendir einnig á væntanlega “mentor‑match” eiginleika sem mun para nýliða með reynslumiklum aðilum til kóðaskoðana. Áhorfendur munu fylgjast með hvort vettvangurinn geti haldið þátttöku eftir nýjungarásinn og hvort samfélags‑stýrt líkanið geti hvatt til svipaðra frumkvöðla í öðrum svæðum. Ef notkunin heldur áfram, gæti Deep‑ML orðið hornsteinn í hagnýtri AI‑menntun, sem fyllir í eyðuna á fræðilegum auðlindum sem hafa til þessa ríkir á markaðnum.
41

GitHub - AlexsJones/llmfit: Hundraðir líkön og þjónustuaðilar. Ein skipun til að finna hvað keyrir á vélbúnaði þínum.

Mastodon +6 heimildir mastodon
GitHub hefur séð nýjan viðbót í verkfærakassan fyrir forritara sem vilja keyra stór tungumálalíkön (LLM) staðbundið: llmfit, skipanalínutól sem skannar RAM, örgjörvakjarna og GPU‑VRAM tölvu, og skilar síðan stuttum lista yfir líkön sem raunverulega passa. Verkefnið, sem Alex Jones hefur skapað, er opinn hugbúnaður og safnar lýsigögnum fyrir hundraðir líkön frá þjónustuaðilum eins og Meta, Mistral og Cohere, og er hægt að leita eftir nafni, stærð eða notkunartilfelli með einföldum skipunum eins og `llmfit search 'llama 8b'` eða `llmfit recommend --use-case coding --limit 3`. Tólið skilar einnig JSON til auðvelds samþættingar í skriftum eða CI‑pípunum. Mikilvægi llmfit
41

fly51fly (@fly51fly) á X

Mastodon +6 heimildir mastodon
reasoning
Fly51fly, forritari þekktur fyrir að deila AI‑tengdum tilraunum á X, tilkynnti nýtt rannsóknarverkefni sem miðar að því að gera ályktun með stórum tungumálalíkönum (LLM) token‑nýtanlegri. Í stuttu færslu lýsti reikningurinn „stýrð spurningaroptimering“ sem aðferð sem minnkar fjölda tokena sem þarf fyrir tiltekna rökfræðiverkefni, á meðan gæði úttaksins eru varðveitt – eða jafnvel bætt. Aðferðin byggir á því að breyta spurningum í rauntíma út frá millistigum frá líkani, sem gerir kerfinu kleift að nálgast svör með færri framvindukörfum. Tilkynningin byggir á þræðinum sem við fjölluðum um 6. apríl 2026, þegar fly51fly fyrst bendi á að kanna aðferðir til að fínstilla spurningar. Nýjasta uppfærslan fer út fyrir kenninguna og sýnir fyrstu viðmiðunartölur sem sýna allt að 30 % minnkun í token‑notkun á hefðbundnum rökfræðigagnasöfnum eins og GSM‑8K og MMLU, með næstum óverulegum tap á nákvæmni. Ef niðurstöðurnar skala, gæti aðferðin leitt til verulegra kostnaðarhagræðinga fyrir fyrirtæki sem keyra ályktun á ský‑GPU eða sértækum hröðunarbúnaði, þar sem fjöldi tokena hefur bein áhrif á verðlagninguna. Iðnaðarskoðendur benda á að token‑nýtanleiki er að verða samkeppnislegur framandi í takt við að LLM vaxa í stærð og ályktunarbúnaðinn þrengist. Með því að draga úr token‑notkun geta forritarar minnkað töf, minnkað orkunotkun og gert háþróuð líkön aðgengilegri fyrir minni aðila. Aðferðin fellur einnig í línu við nýrri strauma í „prompt engineering“ vettvangi sem miða að því að sjálfvirknivæða fínstillingu spurninga. Hvað á að fylgjast með næst: fly51fly lofar útgáfu pre‑printa sem útskýrir reikniritafræðilegan ramma og opinn kóða geymslu. Rannsakendur munu vera spenntir að sjá hvernig aðferðin tengist núverandi kvörðun og destillun pípunum. Skýjaþjónustuveitendur gætu einnig svarað með nýjum verðlögum eða verkfærum sem nýta token‑nýtanlegar spurningar, sem gæti umbreytt efnahagslífi AI‑þjónusta um allt norræna svæðið og lengra út.
41

Getur næsti sími þinn verið samrýmanlegur? Ný tækni og mögulegt Apple‑líkan gera það líklegra

Mastodon +6 heimildir mastodon
apple
Apple nýjasta einkaleyfi bendir til þess að tæknijóriðinn sé að nálgast samrýmanlegan iPhone, þróun sem gæti umbreytt hágæða snjallsímapakkanum og flýtt á samruna vélbúnaðar knúinna gervigreindar. Einkaleyfið, dagsett 21. maí 2024, lýsir tæki sem breytist inn á við með hengilið en heldur áfram að nota „sjálfgjarn“ OLED skjá sem getur lagað smáör á yfirborðinu í gegnum innbyggðar pólýmerlög. Einkaleyfið vísar einnig í innbyggðan stórt tungumálalíkani (LLM) sem myndi sjá um greiningu á skemmdum skjás og kveikja á sjálfvirku lækningarfari, sem gefur vísbendingu um dýpri AI‑samþættingu en Apple hefur áður tilkynnt. Aðgerðin er mikilvæg því samrýmanlegir símar hafa lengi verið í höndum Android framleiðenda, aðallega Samsung, þar sem áætlun þeirra fyrir 2026 leggur áherslu á þynnri ílát, stærri rafhlöður og myndavélamiðaða hönnun. Inngangur Apple myndi færa um
41

MacRumors-sýningin: Hvað er næst fyrir iPad

Mastodon +6 heimildir mastodon
apple
Apple’s iPad roadmap took centre stage on the latest episode of The MacRumors Show, where host Sigurd Sætre and analyst Federico Viticci dissected the company’s imminent hardware refresh. The panel confirmed that the iPad mini will debut its eighth generation with a full‑frame OLED panel, a 120 Hz refresh rate and an under‑display Touch ID sensor, echoing the design language of the iPad Air. The new mini is expected to ship with an A‑series processor—likely the A‑17—while the iPad Air is slated to receive Apple’s next‑generation M4 chip, bringing on‑device AI acceleration that dovetails with the company’s “Apple Intelligence” push. Why it matters is twofold. First, OLED across the mid‑range tier signals Apple’s intent to standardise premium displays beyond the Pro line, a move that could narrow the visual gap with Android flagships and justify higher price points. Second, the M4‑powered iPad Air positions the tablet as a genuine productivity device, capable of running large language‑model workloads locally—a capability hinted at in recent iPadOS 18 beta builds. The shift could reshape developers’ approach to AI‑enhanced apps, especially as Apple’s own LLM services become more tightly integrated. What to watch next are the formal announcements slated for Apple’s “Let loose” event later this month and the WWDC keynote in June. Key signals will be the exact chip specifications, pricing tiers and launch dates for the iPad mini 8 and M4‑Air, as well as any confirmation that the iPad Pro will also adopt the M4. Supply‑chain leaks, FCC filings and early software demos will provide the first concrete clues about how Apple plans to weave AI into its tablet ecosystem. As we reported on April 15, the OLED iPad Mini is already on the horizon; today’s discussion confirms that the rollout is imminent and more expansive than previously thought.
41

Töf á gagnaverum ógna að þrengja AI‑uppbyggingu

Mastodon +6 heimildir mastodon
microsoftopenai
Töf á byggingu nýrra gagnaverða í Bandaríkjunum munu hægja á útbreiðslu generatívra AI‑þjónusta frá stærstu þátttakendum greinarinnar. Greiningar frá iðnaðarsérfræðingum meta að næstum 40 % verkefna sem áætlað er að ljúki í þessu ári – þar á meðal Azure AI miðstöðvar Microsoft, superreiknisklútar OpenAI og “train‑and‑serve” aðstöðu AWS frá Amazon – eru nú í hættu að missa áætlaða dagsetningar um nokkra mánuða. Flöskuhornið rætist í fullkomna stormi af skortum í framboðsrásum, óhóflegum byggingarkostnaði og strangari leyfisreglum í lykilstöðum eins og Texas og
41

Kynning á traustum aðgangi fyrir netöryggi

Mastodon +6 heimildir mastodon
anthropicopenai
OpenAI kynnti nýtt “Trusted Access for Cyber” (TAC) umhverfi þann 16. apríl, og veitti vottuðum netöryggisteymum aðgang að öflugustu módelum sínum, þar á meðal GPT‑5.3‑Codex og nýlega útgefna GPT‑5.4‑Cyber. Fyrirtækið lýsir aðgerðanum sem öryggisfyrsta svar við þeirri trú að “módelin okkar séu of hættuleg til að gefa út,” og velur auðkenni‑ og traust‑byggða vottun í stað opinberrar útgáfu. Forritið byggir á fyrri takmarkaða aðgangsúrræðum OpenAI, eins og líffræðilega miðuðu GPT‑Rosalind sem var tilkynnt þann 17. apríl, og speglar ákvörðun Hvíta húss á sama degi um að veita bandarískum stofnunum Mythos‑módel Anthropic. Með því að takmarka AI með framúrskarandi getu við staðfesta verjenda vonar OpenAI að flýta fyrir ógnagreiningu, sjálfvirka viðbr
38

**Er dagur gagnaverndarinnar að enda?**

Mastodon +6 heimildir mastodon
openai
**Samantekt:** Færsla á Substack-síðunni hjá Brad Delong hefur vakið upp nýjan umræðu um hvort risastór gagnaverndar‑búðir muni áfram vera stoðarbúnaður gervigreindar. Delong heldur því fram að nokkur vel fínstillt líkan, keyrð á 50 Mac Mini tölvum, geti veitt gagnlegar ályktanir á brot af sentími á hverja fyrirspurn—örugglega ódýrara en skýjaþjónustur OpenAI, Anthropic og samkeppnisaðila þeirra. Fullyrðingin byggist á nýlegum framfarum í þjöppun líkana, kvörðun og hagræðingu á tækinu, sem gera “lítil” silíkum kleift að framkvæma verkefni stórra tungumálalíkana án tafar og orkunotkunarpeninga sem fylgja fjarlægum netþjónum. Rökstuðullinn er mikilvægur því iðnaðurinn er þegar að finna álag vegna útbyggingar gagnaverndar. Eins og við skýrðum 18. apríl, hafa byggingartöf, óhófleg orkunotkun og vaxandi tvíþætt árekstur á stjórnmálum dregið úr vexti AI. Fyrsta landsvíðari ástandsbann í Maine á verkefni yfir 20 MW, sem á að gilda til 2027, og viðvaranir Ohio um takmarkanir í rafmagnsneti sýna reglugerðar- og innviðaþrýsting. Ef úthlutun á jaðartækjum getur mætt frammistöðuþörfum í sérstökum notkunartilfellum—eins og rauntímaþýðingu, skynjun sjálfvirkra farða eða lágtíðni meðmælum—gæti það farið framhjá bæði fjármagnsúttekt og pólitísku mótstöðu sem tengist risastórum byggingarverkum. Það sem á eftir að fylgjast með er hvort “Mac‑Mini” frumgerðinn skali út fyrir sértækar sýnikennslur. Nýsköpunarfyrirtæki eru nú þegar að leita eftir áhættufjármögnun til að þróa sérsniðna ASICs og afar hagkvæma GPU-a sem miða að jaðarnotkun, á meðan skýjasamsæjar eru að prófa blandaða líkanir sem flytja þyngstu ályktanir á staðbundin tæki. Lögfræðingar munu líklega rannsaka umhverfisáhrif útbreiðslu milljóna lágorkunóða, og stjórnvöld gætu þurft að aðlaga persónuverndarreglur fyrir dreifða AI. Næstu nokkur mánuðir ættu að sýna hvort tímabilið með gagnaverndum sé að fara í skugga eða einfaldlega að stækka til að innifela sterkt jaðarnet.
37

Allsherð tónlistarsignalvinnsla, vélarnám og stór tungumálalíkön

Frontiers +6 heimildir 2026-04-15 news
Nýtt rannsóknarefni með titlinum **„Allsherð tónlistarsignalvinnsla, vélarnám og stór tungumálalíkön“** hefur verið opnað fyrir innsendingar og merki um breytingu frá hreinum reikniritabrotum til verkfæra sem þjóna tónlistarmönnum, kennurum og öðrum óteknískum notendum. Köllunin, sem gefin er út af ritstjórateymi tímaritsins, bendir á að nýleg vinna hafi ýtt mörkum á mörk hljóð‑tungumálalíkana—svo sem Music Flamingo kerfið sem getur greint og framkallað flókin tónlistaruppbyggingar—en flestir þessir framfarir eru enn í rannsóknarstofum. Ritstjórarnir halda því fram að raunveruleg innleiðing stöðvi vegna þess að þróunaraðilar sjaldan takast á við seinkun, útskýranleika og vinnuferliskerfi sem óverkfræðingar lenda í þegar þeir reyna að innleiða gervigreind í æfingar, lifandi hljóð eða kennsluumhverfi. Af hverju þetta er mikilvægt núna er tvíþætt. Fyrst er AI‑drifið hljóðmarkaður að vaxa hratt; áætlanir segja að AI‑bætt tónlistarframleiðslutól muni ná verulegum hluta af alþjóðlegum DAW‑markaði innan næstu þriggja ára. Í öðru lagi lofar samruni stórra tungumálalíkana (LLM) og signalvinnslupípur “semantic” stjórn yfir timbri, uppsetningu og áhrifum, en aðeins ef hægt er að tjá þessa stjórn í einföldu máli eða í þægilegum hreyfingum. Að brúa þennan bili gæti gert hágæða tónsköpun aðgengilega, lækkað hindranir fyrir sjálfstæða listamenn og opnað nýjar leiðir fyrir aðgengistækni eins og hljóðnæmi‑auka. Það sem á að fylgjast með næst eru fyrstu bylgja greina sem munu koma frá þessu efni. Búist er við tilvikagreinum sem meta LLM‑stýrðar viðmót í samveru við lifandi tónlistarmenn, viðmiðum sem mæla rauntíma seinkun á neytendavörum og tillögum um staðla fyrir samhæfð AI‑viðbætur. Ef samfélagið skilar nothæfum frumgerðum gætu helstu DAW‑framleiðendur og streymisveitur byrjað að innleiða LLM‑stuðningsaðstoð í vörur sínar, og breytt núverandi rannsóknahype í dagleg verkfæri til sköpunar. Framkvæmdin byggir á
36

3 klukkustundir með Claude Opus 4.7: virk námsvefapp og fjarlæg MCP – ein í einu

HN +6 heimildir hn
anthropicclaudecohere
Claude Opus 4.7 sýndi fram á langtíma sjálfstæði sitt í þriggja klukkustunda lifandi prófi sem skilaði fullkomlega virkri námsvefapp og fjarlægum módelstýringarpaneli (MCP) án kóða skrifaðs af manninum. Forritarinn, sem vann út frá einu spurningarorði, bað Claude um að hanna notendaviðmót, búa til Flask bakenda, tengja PostgreSQL gagnagrunn og birta API sem gæti verið kallað frá öðru vafra‑stýrðu stjórnborði. Í nokkrum mínútum gaf módelið út fullkomna verkefnaskel, og eftir stutta lotu af skýringaspurningar bætti það við auðkenningu, bætt við síðuuppsetningu og sett upp stafla á ókeypis Heroku tilvik. Við lokun fundarins var vefappið í lofti, hægt var að slá inn gögn, og fjarlægi MCP leyfði notandanum að breyta módelstærðum og sjá notkun tákna í rauntíma. Ástæðan fyrir því að þetta skiptir máli er tvíþætt. Fyrst staðfestir prófið þær fullyrðingar sem Anthropic gerði í eigin útgáfuupplýsingum um að Opus 4.7 geti haldið „erfitt verkefni“ í klukkustundir, skref langt frá fyrri módelum sem oft hættu eftir nokkur hundruð tákna. Í öðru lagi minnkar hæfni til að framleiða endanleg framleiðslukóða umhverfisferlið sem takmarkaði AI‑hjálpað þróun við brot og frumgerðir. Fyrir sprotafyrirtæki og stórfyrirtæki sem þegar glíma við skort á hæfileikum gæti módel sem sjálft getur skilað í notkunarhæfum þjónustum breytt verkfræðibúskap og flýtt fyrir tíma til markaðar. Það sem þarf að fylgjast með næst er komandi samþætting Anthropic á Opus 4.7 í Vertex AI og AWS Bedrock, sem mun gera módelið aðgengilegt í stórum mæli og mögulega lækka $5‑$25 á milljón tákna hindrunina. Samfélagið prófar einnig bestu vinnuaðferðir sem para nákvæmar áætlanir við „háa‑áreynslu“ spurningarorð, tækni sem var dregin fram í fyrri greiningu okkar á frammistöðu Opus 4.7 þann 18. apríl. Eftirfylgjandi viðmið gegn Sonnet 4.8 og Mythos 5 mun sýna hvort sjálfstæði Opus breytist í stöðuga gæði yfir mismunandi sviðum, og hvort forritarar munu taka það upp sem aðalforritunarpartnar eða halda því í hliðina sem sértækan aðstoðarmann.
36

Útskýranlegir grafnertarnetverk fyrir eftirlit með millibankastreitu: Reglugerða‑samhæft rammaverkefni fyrir bandaríska bankageirann

ArXiv +5 heimildir arxiv
Lið rannsóknarmanna frá Texas háskólanum og Seðlabankanum hefur gefið út nýja forsendingu, „Útskýranlegir grafnertarnetverk fyrir eftirlit með millibankastreitu“, þar sem þeir kynna Spatial‑Temporal Graph Attention Network (ST‑GAT). Líkanið sameinar skilaboða‑flutning í graf‑nertarnetverkum með tímabundinni athygli til að kortleggja bandaríska millibankalánanetið, með daglegum gögnum úr FDIC Call Report og CAMELS‑vísum. Með því að varpa ljósi á hvaða viðskiptavinir og áhættufaktorar drífa upp á hættustig, býður ST‑GAT stjórnendum upp á snemma‑viðvörunarkerfi sem er bæði spáandi og endurskoðanlegt. Tilkynningin er mikilvæg því að eftirlit með kerfisáhættu hefur lengi byggst á samantektarvísum eða óskýrum gervigreindar‑svörtum kassar sem stjórnendur eiga í erfiðleikum með að réttlæta samkvæmt SR 11‑7 leiðbeiningum. Útskýranleg bygging gerir eftirlitsaðilum kleift að rekja framlag banka til smitleiða, sem styður markvissari íhluti áður en krísu dreifist. Aðferðin fellur einnig að vaxandi kröfu um gagnsæja AI í fjármálum og endurspeglar nýlegar kröfur um XAI‑staðla í geiranum. Það sem á eftir að fylgjast með er hversu fljótt rammaverkefnið fer frá fræðilegu frumgerðarverkefni í rekstrarverkfæri. Fjárhagslegur stöðugleiksráð Seðlabankans (Financial Stability Oversight Council) hefur sýnt áhuga á tilraunaverkefnum, og FDIC er áætlað að prófa ST‑GAT gegn eigin álagprófunarpípunum seinna á þessu ári. Samhliða viðleitni Seðlabanka Evrópu (ECB) til að innleiða graf‑byggða áhættugreiningar bendir til víðtækari reglugerðarbreytinga. Ef líkanið sýnir sig traust í raunverulegri bakprófun, gæti það umbreytt makró‑prúðensíulegu eftirliti, hvatt banka til að birta nákvæmari netgögn og kveikt nýja bylgju af útskýranlegum AI‑reglum.
35

Mythos og netöryggi – Schneier um öryggi

Mastodon +6 heimildir mastodon
anthropicclaudegpt-5openai
Claude Mythos Preview frá Anthropic, AI‑líkanið sem getur sjálfstætt uppgötvað og nýtt sér villur í hugbúnaði, hefur flutt úr tæknilegu forvitni í brennipunkt í öryggisumræðu, samkvæmt leiðandi öryggisgreini Bruce Schneier. Í viðtali við *Schneier on Security* var hann aðvarandi að “öryggisvandamálið er langt stærra en eitt fyrirtæki og eitt líkan,” og lagði áherslu á að Mythos er ólíklegt að sé einangrað tilvik. Líkanið, sem Anthropic hefur takmarkað við um það bil 50 yfirfarið fyrirtæki — þar á meðal Microsoft, Apple, AWS og CrowdStrike — var ekki gefið út til almennings eftir innri prófanir sýndu að það gæti framkallað núll‑dagsárásir í stórum mæli. Schneier’s athugasemdir endurspegla áhyggjur sem komu fram í fyrri umfjöllun okkar um Mythos þann 18. apríl, þegar við lýstum fyrst ákvörðun Anthropic um að takmarka aðgengi og möguleika líkanins til að breyta rannsókn á viðkvæmleika. Nýja hornið er breiðari viðbragð iðnaðarins: OpenAI tilkynnti að komandi GPT‑5.4‑Cyber, sem er lýst sem “hættulegu” kerfi fyrir öryggismiðaða verkefni, verður einnig haldið utan um almenna notkun. Forvarnar takmarkanir OpenAI sýna að hæfileikinn til að vopna framleiðandi gervigreind er ekki lengur bundinn við eitt rannsóknarstofu. Áhættan er mikil. Ef öflug kóða‑greiningarlíkön verða almennt aðgengileg, gæti hefðbundna ráðmyndin um að finna viðkvæmleika sé erfitt — og þar með hindrun fyrir fjöldaárásir — horfið. Þessi breyting myndi minnka tímabilið milli uppgötvunar og vopnun, og þvinga verjendur til að treysta á sjálfvirka lagfærslu og AI‑stýrða ógnarveiðar í stað handvirkrar kóðaúttektar. Hvað á að fylgjast með næst: Anthropic og OpenAI eru væntanlega að birta takmarkaðar rannsóknargreinar sem lýsa öryggisúrræðum, á meðan stjórnvalda í ESB og Bandaríkjunum eru líkleg til að koma á vinnuhópum um AI‑studdan netöryggisáhættu. Iðnaðarskoðendur munu
35

Nýtt verkefnamarkmið: Hönnun sérsniðins, trausts og aðgengilegs VST-synth mótuls fyrir Logic Pro

Mastodon +6 heimildir mastodon
ai-safetyappleclaudecopyrightprivacy
Forritari tilkynnti nýtt opið‑kóða verkefni til að byggja sérsniðinn, traustan og fullkomlega aðgengilegan VST‑synth mótul fyrir Logic Pro á macOS, með því að nýta hljóðlíkani Claude’s Opus 4.7. Átakið, sem var sett á opinberu umræðuvefinn 18. apríl 2026, miðar að því að bjóða upp á mótul‑synth sem er hægt að stjórna algerlega með lyklaborði, skjálesurum og aðlögunarviðmótum, á sama tíma og það heldur í lága seinkun sem fagleg viðbótartól krefjast. Verkefnið byggir beint á getu Claude’s Opus 4.7, sem við fjölluðum um í greininni okkar 18. apríl um „Claude Design, Opus 4.7 Regression, GPT‑5.3 & KIMI K2 Benchmarks.“ Opus 4.7 getur framleitt framleiðslu‑kláran DSP‑kóða og notendaviðmótsuppsetningar út frá náttúrulegum tungumálaskilaboðum, og dregur þannig verulega úr þróunartímanum fyrir flókin hljóðverkfæri. Með því að beita þessari krafti í VST‑tól sem keyrir nátúrulega í Logic Pro, lofar verkefnið að minnka tæknilegan hindrunarmúr fyrir tónlistarmenn sem treysta á helstu DAW Apple, sérstaklega þá sem glíma við sjón- eða hreyfihindranir og hafa lengi átt í erfiðleikum með óskýrar viðbótartengingar. Skrefið er mikilvægt vegna þess að VST‑synthar ráða yfir nútíma rafrænni tónlistargerð, en aðgengi er oft á eftirburðarstöðu. Synthur sem uppfyllir WCAG‑AA staðla gæti sett nýtt viðmið, hvatt aðra forritara til að innleiða svipaða eiginleika frá upphafi. Enn fremur sýnir verkefnið hvernig stórt tungumálalíkön geta verið nýtt í rauntíma hljóðverkfræði, og bendir til framtíðar þar sem AI‑búnar viðbætur eru eins algengar og AI‑hjúpað mastering þjónusta. Væntanlegur beta‑útgáfa er áætlað í þriðja fjórðungi 2026, með frammistöðuprófunum gegn núverandi ókeypis synthum eins og Synplant 2 og Pendulate. Forritarinn hyggst nota GitHub‑llmfit verkfæraköfluna til að tryggja að kóðinn keyri á skilvirkan hátt á Apple Silicon, og umræður eru þegar í gangi við aðgengislið Apple um mögulega innlimun í Logic Pro viðbótarmarkaðinn. Viðbrögð samfélagsins munu sýna hvort AI‑knúin, innifalin synth hönnun geti orðið að venjulegri framkvæmd.
35

Apple hefur gefið út þessi 12 nýju vörur í ár

Mastodon +6 heimildir mastodon
apple
Apple hefur staðfest að 12 ný tæki hafi verið sett á markað í 2026, talning sem fer yfir venjulega árlega útgáfu fyrirtækisins og undirstrikar átak til að festa framúrskarandi stöðu í vélbúnaðar‑drifinni gervigreind. Línan, sem er lýst í MacRumors samantekt, inniheldur iPhone 16 Pro og iPhone 16, endurnýjaða iPhone SE 4, iPad Pro knúið af nýja M4 örgjörðinni, iPad Air með uppfærðu M2‑Plus örgjörva, MacBook Air og 14‑tölu MacBook Pro módel sem einnig nota M4 silíku, Apple Watch Series 10 með háþróuðum heilsusensorum, annarrar kynslóðar HomePod mini, Vision Pro 2 blönduð‑raunveruleika hauslúðu, þriðju kynslóð AirPods Pro og endurnýjaða Apple TV 4K. Breidd útgáfunnar skiptir máli af þremur ástæðum. Fyrst, samtímasamsetning mörg M4‑tengd tæki sýnir sjálfstraust Apple til að nýja örgjörva sinn geti tekist á við þunga AI‑vinnslu sem þróunaraðilar krefjast nú þegar, frá stórum tungumálalíkönum á tækinu til rauntíma myndvinnslu. Í öðru lagi, útvíkkað Vision Pro vistkerfi og viðbót AI‑bættu heilsufars eiginleika á klukkunni sýna stefnu Apple um að flétta greind inn í daglegar aukahluti, og skapa nýja tekjustrauma utan iPhone. Í þriðja lagi, fjöldi vara setur þrýsting á samkeppnisaðila eins og Samsung og Google, sem þurfa að flýta upp eigin AI‑miðaða vegvörðum til að halda í keppinaut í hágæða segmentinu. Áhorf til framtíðar bendir á að næsti mikilvægasti áfangastaður verði WWDC 2026 hjá Apple, þar sem fyrirtækið er vænt um að kynna macOS 15, dýpri samþættingu á tækjabundnum LLM‑um og mögulega frumgerð af breytilegu iPhone—hugmynd sem við köllum í fyrri umfjöllunum um tilraunakennda vélbúnað Apple. Fjárfestar og þróunaraðilar ættu einnig að fylgjast með hugbúnaðaruppfærslum sem opna nýja M4 möguleikana, sem og óvæntum þjónustum sem gætu nýtt AI‑eiginleikana sem eru innbyggðir í vélbúnaðinn.
35

Efst í fréttum: ‘iPhone Ultra’ orðrómur, skortur á Mac Mini og Mac Studio, og fleira

Mastodon +6 heimildir mastodon
apple
Framboðskerfi Apple gefur í þessari viku blandað merki. Netverslun fyrirtækisins í Bandaríkjunum er orðinn algjörlega úti á lager fyrir nokkur hágæða Mac mini og Mac Studio stillingar, á meðan nýr orðrómur á kínverskum umræðuforumum og í greiningarfyrirlestrum bendir til væntanlegs „iPhone Ultra“ sem gæti staðið yfir núverandi Pro línu. Útilokunin, sem varð fyrst áberandi á vefsíðu Apple í fjórðungi, snertir efstu útgáfu Mac mini með M5 Pro örgjörva og Mac Studio líkanin sem sameina M5 Ultra með 64 GB RAM. Apple hefur hætt við að taka á móti pöntunum fyrir þessi vörulisti, sem hefur hvatt notendur til að skrá sig á biðlista eða leita að endurnýttu tækjum. Greiningarmenn tengja skortinn við bráðabirgða endurnýjun: orðrómur bendir til þess að Apple muni kynna næstu kynslóð M5‑byggðra Mac tölva seinna á þessu ári, og núverandi birgðir eru hreinsaðar til að gera pláss fyrir nýja útgáfu. Samtímis hefur „iPhone Ultra“ nafnið komið aftur upp í lekkjum. Röð innri skjala sem MacRumors fékk að aðgangi bendir til stærri iPhone með 6,9‑tölu LTPO skjá, per‑pixel skynjara‑skift myndavélastöðvunarkerfi og nýjum titaniummótu. Tækið yrði samkvæmt upplýsingum búið með væntanlegum A18X örgjörva og 1 TB grunn geymslu, og myndi setja sig fram sem dýrmætur valkostur við Pro Max. Eins og við skýrðum 18. apríl um möguleikann á brettum iPhone, merkir Ultra orðrómurinn áframhaldandi átak Apple til að stækka flaggskipaflokkinn. Afleiðingar eru tvíþættar. Fyrir fagfólk gæti skorturinn á Mac mini og Mac Studio tafað mikilvæga vinnuferla sem reiða sig á afköst Apple silíkon, á meðan iPhone Ultra gæti endurskapað hágæða snjallsímamarkaðinn og sett nýjar væntingar til myndavélar og rafhlöðu. Það sem á eftir að fylgjast með: framboðskerfisfundir Apple í næstu vikur, allar opinberar yfirlýsingar um Mac endurnýjun, og möguleg vöruafkoma á september World­wide Developers Conference, þar sem iPhone Ultra gæti loksins verið staðfest.
35

One Month með MacBook Neo og að finna mörkin

Mastodon +6 heimildir mastodon
applechips
Apple nýjasta fartölvan, MacBook Neo, hefur eytt fyrsta mánuðinn í höndum eldri verkfræðings sem skipti um M3‑knúna MacBook Air fyrir 13‑tölu, A18 Pro‑byggða módelinn. Viðhorf ritrýnarins, gefið út á CNET, lofar sléttan ílát, líflegan Liquid Retina skjá og loforð um „Apple Intelligence“ innbyggt í örgjörvinn, en bendir á eitt áberandi skort: grunnuppsetningin með 8 GB af sameinaðri minni verður fljótt flöskuháls fyrir dagleg verkflæði sem krefjast AI. Á meðan á prófuninni stóð, keyrði höfundurinn blöndu af vefmiðaðum verkefnum, staðbundinni LLM‑útreikningi í gegnum Claude Opus 4.7, og venjulegri Safari‑vafurferð með mörgum flipum. Minnisþrýstingur hækkaði um leið og eitt gluggi með Claude‑stýrðum kóðaútfyllingu opnaðist, sem þvingaði kerfið til að swap-a og olli áberandi töf. Jafnvel venjuleg fjölverkavinna—tölvupóstur, skjalaútfærsla og GitKraken‑Claude samþætting í bakgrunni—var yfir mörkum RAM í Neo, sem stangast á móti markaðssetningu Apple um að tækið sé „byggt fyrir AI“. Mörkin eru mikilvæg vegna þess að Apple setur Neo í framúrskarandi stöðu sem inngangsleið fyrir fyrirtæki sem vilja útvega lið með AI‑tæknilegu vélbúnaði fyrir undir £100 á mánuði. Ef grunnuppsetningin getur ekki haldið í þær vinnulóðir sem hún er seld fyrir, gætu fyrirtæki þurft að uppfæra í enn ótilkynntu 16 GB útgáfuna eða halda í dýrari MacBook Air og Pro módel. Þetta vandamál fellur einnig að viðvarandi birgðaskorti: takmarkaður birgðir af Neo, sem þegar eru pressaðar af eftirspurn, gætu séð hægari umferð ef minni takmarkið reynist óumflýjanlegt. Það sem þarf að fylgjast með næst er hvort Apple muni koma með Neo með meiri minni í næstu fjórðungi, eða gefa út hugbúnaðaruppfærslur sem stjórna sameinuðu minni betur fyrir LLM‑verkefni. Greiningarmenn munu einnig fylgjast með hvernig verðlagning Neo og leigusamningsáætlanir þróast í ljósi viðbragða frá fyrstu notendum, og hvort tækið geti endurheimt hreyfingu í breiðari AI‑vélbúnaðar keppni.
35

Indland krefst ekki þess að Apple forstillir Sanchar Saathi á iPhone

Mastodon +6 heimildir mastodon
applegoogle
Apple hefur vítt um sig frá því að stjórnvöld krefjist forstillingar á Sanchar Saathi, stafrænu auðkenningaforriti Indlands, á iPhone sem eru seldar í landinu. Aðgerðin kemur eftir viku af hitaðri umræðu eftir að ráðuneyti fyrir rafeindatækni og upplýsingatækni beindi öllum snjallsímahönnuðum, þar á meðal Apple, að inn
35

Stjóri mannauðs hjá Citadel fer frá fyrirtækinu á meðan áhættufjárfestingarfélög keppa um hæfileika.

Mastodon +6 heimildir mastodon
apple
Stjóri mannauðs hjá Citadel, Sjoerd Gehring, hefur sagt upp störfum sínu hjá 67 billið dollara stærða áhættufjárfestingarfélaginu eftir minna en tvö ár í starfi, skýrir Business Insider þann 17. apríl. Gehring, sem kom til Citadel frá Apple í lok 2024 eftir að hafa starfað í stjórnunarstöðum hjá Johnson & Johnson og Accenture, fékk það verkefni að stækka mannauðsflæði fyrirtækisins í takt við vaxandi samkeppni um fjármálagreindarviðskiptafræðinga, gagnafræðinga og AI-sérfræðinga á Wall Street. Útþvingunin varpar ljósi á víðtækt mannauðsþrengsli sem er að umbreyta áhættufjárfestingarbransanum. Þegar fyrirtæki leggja milljarða í eigin viðskipta‑líkanir og generative‑AI verkfæri, hefur skortur á verkfræðingum sem geta brennt saman fjármálum og vélarnámi gert ráðningaraðila að áberandi, háttlaunaða leikmenn. Citadel, sem hefur verið að auka sérfræðiteymi í ráðningum og aðlaða tæknimenntaðan mannauð, stendur nú frammi fyrir áhættu á að missa hreyfingu í AI‑drifnum stefnum sínum án eldri mannauðsstjóra til að stýra ráðningum, viðhaldi og menningarverkefnum. Það sem kemur næst mun sýna hvernig Citadel og samkeppnisaðilar aðlagast. Áhorfendur munu fylgjast með hvort fyrirtækið setur nýjan forystumann til með djúpum AI‑ráðningareynslu eða snýst í átt að dreifðum ráðningarlíkani sem nýtir ytri ráðningarfyrirtæki. Skrefið vekur einnig spurningar um sjálfbærni „ráðningaraðila‑sem‑stjarna“ líkanins; ef efstu mannauðsstarfsmenn halda áfram að hoppa milli fyrirtækja, gætu áhættufjárfestingarfélög þurft að endurskoða launakjör og ferlaskipulag fyrir stjórnendur í mannauðsstörfum. Áhugasamir aðilar ættu að fylgjast með næstu ráðningatilkynningum Citadel, öllum breytingum í AI‑teymisútrásum og hvort aðrir stórir sjóðir—eins og Bridgewater, Two Sigma og Renaissance—tilkynni sambærilegar stjórnendabreytingar. Niðurstaðan mun gefa vísbendingu um hvernig greinin jafnar keppnina um háþróaða AI‑mannauð gegn óstöðugleika í stjórnendaskipti á hærri stigum.
35

AirPods Pro 3 eru núna $50 ódýrari, nánast jafngildir bestu verði þeirra til dags

Mastodon +6 heimildir mastodon
apple
Apple hefur lækkað verðið á þriðju kynslóð AirPods Pro um $50, sem dregur framúrskarandi eyraðina niður í hálft á $200 í flestum mörkuðum. Tilboðið, sem tilkynnt var á The Verge og endurspeglað af nokkrum evrópskum smásöluaðilum, er jafnt við lægsta verðið sem líkanið hefur séð síðan það kom á markað síðustu hluta ársins 2023. Lækkunin kemur í því skyni að Apple undirbýr næstu bylgju af burðarlegum tækjum. Greiningaraðilar bíða eftir AirPods 4, um það er talað að þau muni bjóða upp á nýja hljóðdrifjaraflfræði og dýpri samþættingu við Vision Pro, og að þau komi út seinna á þessu ári. Með því að lækka kostnað núverandi kynslóða getur Apple hreinsað birgðir á meðan það heldur AirPods línunni aðlaðandi fyrir verðnæm viðskipt
35

OpenAI (@OpenAI) á X

Mastodon +6 heimildir mastodon
openai
OpenAI hefur tekið fyrsta skrefið sitt inn í líftækni um skref frekar, og sýnt nákvæma sýn á “Life Sciences” líkanaröðina sem hún kynnti í síðustu viku. Í hálftímum langtímaþætti OpenAI Podcast útskýra rannsóknarstjóri Joy Jiao og vöruhaus Yunyun Wang hvernig líkanin eru hönnuð fyrir líffræði, lyfjagrein og umhverfisfræðilega læknisfræði, og leggja fram hagnýtar notkunartilfelli frá spá um próteinuppbyggingu til tilgátugerðar fyrir ný lyf. Umræðan byggir á takmarkaða aðgangi að GPT‑Rosalind líkani sem tilkynnt var 17. apríl, sem merkti fyrstu opinbera útgáfu OpenAI á stórum tungumálalíkani sem er fínstillt fyrir líftækniverkefni. Með því að útfæra vegvísinn gefur fyrirtækið til kynna að röðin sé að fara frá frumgerðarstigi yfir í víðtækari aðgengi fyrir háskólalaboratorí og lyfjafyrirtæki. Af hverju þetta skiptir máli er tvíþætt. Fyrst hefur líftæknageirinn lengi treyst á sértæk verkfæri eins og AlphaFold frá DeepMind; fjölhæft LLM sem getur greint vísindalega bókmenntir, lagt til tilraunahönnun og skrifað reglugerðar skjöl gæti minnkað mörg ár rannsóknar í mánuði. Í öðru lagi eykur þátttaka OpenAI keppnina um AI‑stýrða lyfjapípur, sem gæti umbreytt fjármagnsstraumum og hvatt stjórnvöld til að takast á við kröfur sem eru gerðar af AI. Það sem á eftir að fylgjast með eru útfærsluferlið. OpenAI hefur bent á stigveldisaðgangslíkani sem mun tengja API
35

Gökdeniz Gülmez (@ActuallyIsaak) á X

Mastodon +6 heimildir mastodon
applebenchmarks
Apple hefur kynnt **MLX‑Benchmark Suite**, fyrsta alhliða viðmiðunartól sem er hannað til að meta frammistöðu stórra tungumálalíkana (LLM) á opna MLX‑rammanum sínum. Tilkynnt af vélarnámsrannsakanda Gökdeniz Gülmez á X, inniheldur pakkanum skipanalínusvið og vandlega valið gagnasett sem prófar getu líkana til að skilja, búa til og villuleita kóða. Með því að sjálfvirkni þessa lykilverkefna þróunaraðila veitir verkfærið verkfræðingum hagnýta leið til að bera saman hvernig mismunandi LLM eru keyrðir á Apple silicon og til að fínstilla ályktunarpípur. Útgáfan er mikilvæg vegna þess að MLX‑rammi Apple, sem var settur á markað snemma á þessu ári, lofar háum gagnagjöf, lágum tafum í AI‑verkum á M‑raðaflíkum fyrirtækisins. Fram til þessa hafa þróunaraðilar ekki haft staðlaða mælikvarða til að meta skilvirkni og ná
35

Apple-yfirlögmaður sem lést eftir 31 ár deildi nostalgískri gátreikning frá síðasta degi

Mastodon +6 heimildir mastodon
apple
Langvarandi vörumarkaðsstjóri Apple, Stan Ng, hefur formlega sagt upp störfum eftir 31 ár sem náðu yfir kynningu á iPod, iPhone, Apple Watch og AirPods. Í LinkedIn‑færslu sem fljótt varð vírusað, birti Ng „nostalgíska gátreikning“ yfir helgjuverkefnin sem hann lauk á síðasta degi í Apple Park, frá því að horfa á sólarupprás yfir háskólalóðinni til þess að taka einmana hjólferð um hringlaga umhverfi höfuðstöðvarinnar. Listinn innihélt einnig fljótlegan skoðun á innhólfi hans, síðustu göngu um hönnunarrýmin þar sem Apple Watch og AirPods voru fyrst skissuð, og táknræna „undirritun“ á markaðssetningarkortunum fyrir komandi vörulotu. Útskrifunin merkir brottför eins af fáum stjórnendum sem hafa yfirumsjón með markaðssetningu Apple‑nefnistækja í gegnum þrjár vörutímabil. Ng’s brottför kemur í kjölfar þess að fyrirtækið flýtir á innleiðingu í heilbrigðistækni, aukna veruleika og AI‑stýrðar þjónustur, sviðum sem nú munu vera í forystu yngri hóps stjórnenda. Greiningaraðilar líta á brottför hans sem litmælir á því hversu vel Apple getur flutt fram vörumerkjasögu sína án stöðugrar handar sem hjálpaði til við að móta táknræna herferðirnar „Shot on iPhone“ og „Feel the Beat“. Eftirlitsfólk í greininni mun fylgjast með hver Apple velur til að fylla lausa varamannsstöðu og hvort nýi leiðtoginn mun leggja meiri áherslu á generative‑AI verkfæri við gerð herferða – þróun sem Ng vísbjó til með því að segja að hann notaði LLM til að draga upp hluta kveðjuskýrsins. Ákvörðunin vekur einnig spurningar um varðveislu hæfileika í eldri stjórnendahópi Silicon Valley, sérstaklega þar sem keppinautar eins og Google og Microsoft leggja meiri áherslu á AI‑miðaða markaðssetningu. Næstu vikur ættu að afhjúpa arftökustefnu Apple og sýna hvernig fyrirtækið hyggst halda vörusögu sinni ferskri í sífellt AI‑knúnum markaði.
32

Einn af kostunum við #LLM og #genAI sem eru í forgrunni alls staðar er að það raunverulega ber

Mastodon +6 heimildir mastodon
multimodal
Upphafsbylgja opinskáps um stór tungumálalíkön (LLM) og sköpunargervigreind (GenAI) hefur byrjað að kvikna á þróunarfórum og í samfélagsmiðlum, þar sem margir þátttakendur segja að áferðin sé að „koma fram í raunverulegri eðli margra FLOSS‑þróunaraðila.“ Viðkomandi athugasemd kemur í kjölfar bylgju af háprofíls útgáfum – Meta‑Llama 2, Mistral 7B og samfélagsdrifna verkfærinu „llmfit“ sem tengir líkan við staðbundið vélbúnað – sem hafa minnkað hindrunina fyrir hvern sem vill keyra, fínstilla eða dreifa öflugu transformer‑líkan á fartölvu eða á hóflegum netþjóni. Af hverju þetta skiptir máli er tvíþætt. Fyrst og fremst breytir flóðið af kóða, viðmiðum og útgáfum líkana opinskáps vistkerfinu í hratt þróunarverkstæði fyrir næstu kynslóð AI‑þjónusta, og flýtir nýsköpun langt hraðar en hefðbundin R&D í fyrirtækjum. Í öðru lagi sýnir sama opinleiki mismunandi viðhorf: margir þróunaraðilar fagna lýðræðislegri aðgengi að AI, á meðan aðrir tjá óánægju með leyfiságreiningar, sjálfbærni‑kostnað og auðvelduna sem felst í því að illgjarnir aðilar geti endurnýtt líkön. Eins og við skýrðum 18. apríl 2026 í umfjöllun okkar um „llmfit“ geymsluna, hefur hæfileikinn til að tengja líkön við vélbúnað þegar kveikt á kapphlaup meðal sprotafyrirtækja og áhugafólks til að setja upp framleiðslu‑API án þess að kaupa skýjarkredit. Áframhaldandi þróun líkist því að móta þrjá lykilþætti. Norðurlöndin, með sterka arfleifð í opnum hugbúnaði, gætu séð nýjar opinberar verkefni sem innleiða persónuverndar‑by‑design í LLM‑pípur. Fyrirtæki munu fylgjast með hvort opinskápsbylgjan neyðir þau til að opna hluta eigin tækjabúnaðar eða til að innleiða strangari aðgangsstýringar. Að lokum eru reglugerðarstofnanir í ESB og Svíþjóð á leiðinni að setja fram leiðbeiningar um opinskáps AI‑leyfi og áhættumat, skref sem gæti annaðhvort styrkt traust í greininni eða sett nýjar samræmingarkröfur. Næstu mánuðir munu sýna hvort þessi opinskápsbylgja verður varanlegur stoðarbjalla í GenAI‑landslaginu eða bara flýgurbylgja knúin af áferð.
32

**Gervigreind hefur eigið skilaboðavandamál**

Mastodon +6 heimildir mastodon
anthropicdeepmindgoogle
Fyrirtæki í gervigreind glíma við nýja tegund ádeilu: hvernig líkan þeirra tala við notendur. Eftir bylgju ádeilu um að spjallmenni birti oft of varar, umhverf eða jafnvel niðrandi svör, snúa fyrirtækin að heimspekingum og prestum
32

Microsoft Surface verðhækkun veldur minnkun í minni: Hver stór framleiðandi minnisflipa—SK Hynix, Micron eða SanDisk—býður bestu fjárfestingarverðmæti?

Mastodon +6 heimildir mastodon
agentschipscopilotmicrosoft
Microsoft hefur hækkað verðskýringarnar á Surface vörulínunni, bætt $100–$500 við flest líkan, í takt við að iðnaðurinn glímir við endurnýjaðan skort á vinnsluminni (RAM). Hækkunin, sem er staðfest í Microsoft‑versluninni og skráð af Windows Central, endurspeglar óhóflega hækkaða kostnað við DRAM‑ og NAND‑flíka, sem hafa verið þrýstir af eftirspurnaraukningum á tímum heimsfaraldurs, flasakörum í framboðarkeðju og sprengikrafti gervigreindar‑gagnaverða. Með því að láta neytendur bera hærri kostnað íhluta, gefur Microsoft til kynna að skorturinn sé ekki lengur tímabundinn flækja heldur byggingarbundin takmörkun sem snertir dýrari tölvur. Aðgerðin nær langt út fyrir fartölvumarkaðinn og setur þrjá stærstu framleiðendur minnisflipa—SK Hynix, Micron og SanDisk (NAND‑deild Western Digital)—í fjárfestingarathygli. SK Hynix, heimsins næststærsti DRAM‑birgi, nýtir sér áætlaða kapacitetsaukningar í Suður-Kóreu, sem miða að því að bæta um meira en 300 GB á sekúndu af nýjum framleiðsluárangri til ársins 2027. Micron, eina bandaríska DRAM‑framleiðandinn, er í keppni um að auka 3‑D‑stafla tækni sína, en hagnaður fyrirtækisins er enn óstöðugur vegna breytilegs eftirspurnar frá bæði neytendatölvum og fyrirtækja‑AI‑verkefnum. SanDisk, þó aðallega NAND‑spilari, nýtir fjölbreyttan vöruúrval sem innifelur solid‑state drif fyrir gagnaverstölvuþjóna, hluta sem vaxandi vegna þess að generative‑AI módel þurfa sífellt meiri geymslu. Fjárfestar ættu að fylgjast með ársfjórðungsárangri til að greina hvernig hvert fyrirtæki jafnar birgðir sínar gegn áframhaldandi flíkur‑uppsöfnun, auk tilkynninga um nýja framleiðslukapacitet eða sameiginlegar viðskipti sem gætu breytt samkeppnisstöðu. Frekari verðbreyting frá Microsoft, eða umferð í átt að öðru silíki eins og LPDDR5X, myndi prófa eftirspurnar‑elastík og gæti umbreytt tekjuútliti fyrir þessa þrjá framleiðendur. Næsta árangursárstíð, áætluð fyrir snemma í þriðja fjórðungi, mun líklega sýna hver framleiðandi er best í stakk búnir til að græða á áframhaldandi minniskröfu.
32

fly51fly (@fly51fly) á X

Mastodon +6 heimildir mastodon
Kínverskur gervigreindarrannsakandi og prófessor við Beijing University of Posts and Telecommunications, fly51fly, tilkynnti nýja nálgun til að auka getu stórra tungumálalíkana (LLM) til að vinna með mjög löng inntök. Í færslu á X kynnti hann „Shuffle the Context“, sjálf‑útdráttar (self‑distillation) aðferð sem breytir vinsælu Rotary Positional Embedding (RoPE) til að varðveita upplýsingar betur yfir lengri táknaglugga. Með því að blanda handahófskenndum hluta af samhengi í kennslu‑nemanda (teacher‑student) þjálfunarhringi, neyðir aðferðin líkanið til að læra staðsetningalausa (position‑agnostic) framsetningar á meðan röð er enn virt, sem gerir það kleift að halda samhangandi texta yfir tugþúsundir tákna. Framfarirnar eru mikilvægar vegna þess að meðhöndlun langt samhengi er ennþá helsta takmörk LLM í raunverulegum forritum, svo sem greiningu á lögfræðilegum samningum, yfirferð vísindalegra greina og fjölþrepa samtöl. Núverandi lausnir — renna gluggar (sliding windows), endurheimt‑aukið framleiðsla (retrieval‑augmented generation) eða að stækka athyglina (attention) í 100 k‑táknaglugga — krefjast annaðhvort mikils útreikningskostnaðar eða fórna nákvæmni. „Shuffle the Context“ lofar léttvægri aðlögun sem er hægt að beita á fyrir‑þjálfaða líkön án fullrar endurþjálfunar, og gæti þannig skilað hærri nákvæmni í viðmiðum eins og LongBench og í sértækum verkefnum sem krefjast djúprar röksemdafærslu yfir víðfeðmtum textum. Eins og við skýrðum 6. apríl, hefur fly51fly verið áberandi r voice á X, þar sem hann deilir nýjungum frá tjáningargreindum í stafrænum sýndarímyndum til kóða‑miðuðra LLM. Þessi nýjasta framlög bætir nýjum vídd í hans feril, með áherslu á vandamál sem breið AI-samfélagið er að keppa um að leysa. Hvað á eftir að fylgjast með: Fullur grein er væntanlegur á arXiv innan nokkurra daga, ásamt opnum kóðaútfærslu. Snemma notendur munu líklega bera aðferðina saman við OpenAI‑GPT‑4 Turbo með 128 k‑táknaglugga og Anthropic‑Claude 2.1. Atvinnugreiningarmenn ættu að fylgjast með hvort kínversk rannsóknarstofnanir eins og Zhipu AI eða Alibaba innleiði „Shuffle the Context“ í næstu kynslóð líkanna, og hvort aðferðin hentar fjölmiðla‑ eða endurheimt‑aukið pípuröð. Ef kröfurnar standast, gæti þessi nálgun orðið staðlað viðbótartól til að stækka samhengi‑glugga án óhóflegs kostnaðar við að þjálfa enn stærri transformer‑líkan.
32

scythe@八方塞がり (@keiyotokei) á X

Mastodon +6 heimildir mastodon
gpt-5openai
OpenAI hefur hafið GPT‑5.4‑Pro, nýjan hágæða stórt tungumálalíkani sem er í boði á grunnverði 100 $ á mánuði. Tilkynningin, sem var sett á X af notandanum @keiyotokei, merkir að fyrirtækið reynir að gera sín mest hæfileikaríkustu líkön fjárhagslega aðgengilegri eftir tímabil þar sem aðeins fyrirtækjavörðurir fengu aðgang að dýrum lausnum. Fyrirlið er mikilvægt því það minnkar bilið milli nýjustu gervigreindar og fjárhagsáætlana smáfyrirtækja, rannsóknarlabba og jafnvel háþróaðra áhugamanna. Fram til þessa voru öflugustu útgáfur OpenAI‑líkananna—eins og GPT‑4 Turbo—í rauninni læst bak við notkunarbundna API‑kröfur eða dýrar fyrirtækjavörðurir. Fast verð á 100 $ gefur “pro‑grade” líkan innan seilingar margra norðurlandafyrirtækja sem hafa þurft að treysta á eldri útgáfur eða á samkeppnisaðila eins og Anthropic og Google Gemini. Fyrir forritara einfaldar áætlanagerð með fyrirsjáanlegum kostnaði þróun á vörum sem þurfa stöðuga, lágseinkunartíma svar,
32

Á þeim tíma var Skýið eitt stórt atriði. Nú kalla sumir eins og ég það bara annarra fólks tölvu.

Mastodon +6 heimildir mastodon
Bylgja af umfjöllun á samfélagsmiðlum er nú þegar að endurmynda stórmálalíkön (LLM) í einföldum orðum sem endurspegla hvernig „skýið“ var afmyndarítt fyrir um tíu ár síðan. Færsla sem varð vírusað á X á þriðjudaginn líkjaði nútíma AI‑hype við fyrstu skýárásina, og sagði: “the cloud was this one big thing. Now some people like me call it just other people’s computers.” Höfundurinn spurði síðan hvernig við munum endurnefna LLM þegar áferðin róast, og lagði til almenns heitis “statistical probability predictor”. Athugunin snertir vaxandi tilfinningu meðal tæknifræðinga og markaðsmanna um að glitrandi vörumerki AI sé að slokkna. Þegar „cloud computing“ varð orðasamband í byrjun áratugarins 2010, lögðu birgjar loks á sig fleiri hagnýtar lýsingar – SaaS, IaaS, PaaS – sem endurspeglaðu undirliggjandi þjónustulíkanið. Greiningaraðilar varða nú að svipað endurmerking gæti verið á næsta leiti fyrir gerandi AI, sérstaklega þar sem fyrirtæki glíma við kostnað, áreiðanleika og reglugerðarumsjón. Af hverju er þetta mikilvægt? Tvöfalt. Fyrst, orðaforða mótar almenningsálit og stefnu; breyting frá „AI“ yfir í tæknilegra orðalag gæti minnkað ótta sem knýr til krefjandi reglugerða. Í öðru lagi gæti það haft áhrif á vörustöðu: birgjar sem taka upp hógvært heiti gætu öðlast traust hjá áhættufælum viðskiptavinum, á meðan þeir sem halda fast í hype geta lent í áfalli. Þessi þróun speglar einnig innri breytingar í leiðandi rannsóknarstofum, þar sem nýlegir brottförir eldri starfsmanna hjá OpenAI undirstrika yfirfærslu frá spekulatívum verkefnum yfir í hagnýtara lausnir. Það sem á að fylgjast með næst eru fyrstu hagnýtu tilfelli af nýjum nöfnum í fréttatilkynningum, þróunarskjölum og stefnumótun fyrirtækja. Ef stórir skýjaþjónustuaðilar eða eigendur AI‑vettvangs byrja að lýsa líkönum sínum sem „probability engines“ eða „predictive text services“, er líklegt að þessi tungumálabreyting festist í iðnaðarstaðlum og breyti því hvernig næsta kynslóð gerandi tækja er selt, reglugerð og skilið.
29

Í síðustu viku tók ég þátt í þjálfun um #IREB. Næstu viku ætla ég að taka vottunarprófið.

Mastodon +6 heimildir mastodon
googletraining
A software engineer who recently completed an IREB Foundation Level training turned to Google’s Notebook LM to turn the 180‑page official syllabus into a set of practice quizzes and flashcards. The AI‑driven notebook parsed the dense requirements‑engineering material, generated multiple‑choice questions and spaced‑repetition cards, and delivered them in a format the candidate could review on a laptop or phone. The self‑created study set, the engineer says, “are really good and help” in the final weeks before the supervised, time‑boxed CPRE‑FL exam administered by iSQI. The experiment highlights a growing trend in the Nordic tech community: leveraging generative AI to streamline professional certification prep. Traditional courses from providers such as IREB‑CPRE, ISTQB and Agile trainers often rely on static slide decks and printed workbooks, which can be time‑consuming to digest. Notebook LM’s ability to extract key concepts, formulate plausible distractors and organize them into adaptive quizzes cuts preparation time and may raise pass rates, especially for busy developers juggling project work. Industry observers note that certification bodies have not yet formalised rules for AI‑assisted study aids, but the IREB board has expressed interest in how digital tools affect candidate performance. If AI‑generated content proves reliable, training firms could embed similar capabilities into their platforms, offering personalised learning paths at scale. Conversely, exam administrators may tighten supervision protocols to guard against inadvertent leakage of AI‑crafted questions. Watch for announcements from IREB and iSQI in the coming months regarding policy updates on AI‑supported preparation. Meanwhile, training companies such as Trendig and Serview are already marketing AI‑enhanced modules, suggesting that the next wave of requirements‑engineering education will be shaped as much by machine learning as by human expertise.
29

Opus 4.7 er ekki einfaldur uppfærsla. Anthropic bætti við raunverulegum eiginleikum: xhigh effort, adaptive thinking, task

Mastodon +6 heimildir mastodon
anthropicbenchmarksclaude
Anthropic setti í loftið Claude Opus 4.7 þann 16. apríl og lýsti því sem „raunverulegri uppfærslu“ frekar en smáviðgerð. Nýja líkanið kynnir hár‑áreynslu rökstuðningsstig, aðlögunarhæfar hugsunarspurningar, stjórnun á verkefnisfjárhagsáætlunum og áberandi sjónbætingu sem þrefaldar myndupplausn og hækka sjónskarpleika í 98,5 % . Á sama tíma braut útgáfan niður API-samhæfni, skipti út tokena‑þjapparanum fyrir annan sem eykur fjölda tákna um allt að 35 % og leiddi til skjótlegrar andspárar sem gerði Anthropic að hækka takmarkanir á fjölda beiðna fyrir alla notendur. Eins og við skýrðum þann 18. apríl í greininni „Claude Opus 4.7 greining á greind, frammistöðu og verði“, voru fyrirsagnartölurnar áhrifaríkar: færri villur í skjala‑rökstuðningi og nýir forritunargeta sem yfirgáfu bæði Opus 4.6 og Sonnet 4.6. Nýjustu gögnin sýna nú flóknari mynd. Á NYT Connections viðbótarmælikvarðanum skoraði Opus 4.7 **41 %** á móti **94,7 %** fyrir 4.6, og raunverulegir forritarar skrá í sífelldum minnkunum í forritun og rannsókna. Hækkun tokena fjöldans þýðir 5‑35 % hærri raunveruleg kostnaður, þó að skýrt verð haldist óbreytt. Uppfærslan skiptir máli því mörg fyrirtæki hafa byggt vinnuferla á fyrirsjáanlegum token‑eðlisfræðilegum þáttum og API‑samningum Opus 4.6. Skyndileg token‑inflation brýtur niður fjárhagsáætlanir, á meðan brotnir endapunktar krefjast kóðabreytinga og prófunar. Á sama tíma opna sjónbætingarnar nýja vöru­tækifæri fyrir greinar eins og smásölu, læknisfræðilega myndgreiningu og sjálfvirka eftirlit, sem gætu umbreytt samkeppnisstöðu Anthropic gagnvart multimodal lausnum OpenAI. Það sem þarf að fylgjast með næst: Ferlið fyrir flutning Anthropic, sem á að koma út seinna í þessari viku, mun innihalda token‑umbreytingarformúlur og ráðlagða spurningarbreytingar. Samfélagið prófar nú lausnir til að draga úr kostnaðarbrestum, og um ryk er að eftirfylgiskipti verði í byrjun maí til að takast á við tungumálalíkans‑afturfall. Fylgist með hvort Anthropic breyti verði eða endurvekji „drop‑in“ stig, og hvernig keppinautar bregðast við með eigin multimodal uppfærslum.
29

OpenAI hættir, krefst að Codex beri kostnaðinn

Mastodon +6 heimildir mastodon
openaisora
OpenAI tilkynnti um víðtæka umskiptingu sem mun sjá rannsóknardeildina sína innfelld í Codex‑vettvanginn og Sora‑verkefnið fyrir myndavinnslu niðurfellt. Fyrirtækið sagði að það sé núna „að byggja allar tilraunir á fjármálareikningshaldi frekar en á fjarlægðarmarkmiðum“, þar sem útreikningsfjárhagsáætlanir verða aðalgáttin fyrir nýtt starf. Afleiðingin er að vísindadeildin – sem áður leitaði langtímabrot í fjölbreyttum gervigreind – verður innleidd í Codex, AI‑aðstoðarmanninn sem þegar stjórnar bendli á skjáborðinu, býr til myndir, man eftir notendakjörum og keyrir vaxandi safn íforrita. Þessi ákvörðun táknar ákveðinn snúning frá sjálfsmynd OpenAI sem rannsóknarstofu í átt að hreinum vettvangsrekstri. Með því að beina allri þróun í átt að tekjuöflunarfyrirtæki vonast fyrirtækið til að réttlæta gríðarlegan ský‑útreikningskostnað sem hefur vaxið í takt við útgáfu GPT‑4‑Turbo og nýlegu Claude Opus 4.7‑uppfærslu keppinauta. Ákvörðunin kemur einnig í kjölfar áberandi brottfalla Kevins Weil og Bill Peebles, sem við skýrðum um 18. apríl, og víðtækari tilraun fyrirtækisins til að losna við „hliðaverk“ sem ekki næða beint til tekna. Af hverju þetta skiptir máli er tvíþætt. Fyrst, að sameina rannsóknir undir Codex gæti flýtt fyrir útgáfu eiginleika sem dölja mörkin milli kóðagenerunar og almennrar AI, og gefið OpenAI sterkari varnarstöðu gegn nýlegum ávinningum Anthropic. Í öðru lagi gæti áherslan á kostnaðar‑stýrða verkefnisval dregið úr hraða grundvallarbrotum, breytt samkeppnisumhverfi grunnlíkana og hugsanlega takmarkað opna‑rannsóknarhugmyndafræðina sem einu sinni einkenndi greinin. Það sem á eftir að fylgjast með er tímalínan fyrir lokun Sora, útgáfa næstu Codex‑uppfærslu – sem er væntanleg að dýpka skjáborðssamþættingu og auka íforritasafnið – og hverju reglugerðarviðbragði kemur í veg fyrir nýja „fjármálareikningshalds“ rammann OpenAI, sérstaklega eftir stuðning þess við ábyrgðarvernd Illinoise fyrr í þessum mánuði. Geirinn verður spenntur að sjá hvort þessi breyting skili sjálfbærum vexti eða merki um tilhvarf frá metnaðarfullri AI‑rannsókn.
29

OpenAI styður lög í Illinois sem verndar AI-fyrirtæki frá ábyrgð vegna fjöldaofbeldis

Mastodon +6 heimildir mastodon
anthropicopenai
OpenAI hefur lagt sitt af mörkum til Illinois-senaturlögs 3444, aðgerð sem myndi veita þróunaraðilum á mörkum gervigreindar (frontier‑AI) ónæmda gegn réttarfari vegna “fjöldaofbeldis” atburða – skilgreindar sem atburðir sem valda 100 eða fleiri dauðum eða skaða sem yfirskrifar milljarð dollara. Lögin, sem eru á ferli í ríkislöggjafarþingi, miða að því að vernda fyrirtæki frá borgaralegri ábyrgð þegar módel þeirra er notað í aðstæðum sem leiða til eyðileggjandi skaða, svo sem sjálfvirkri vopnaútgáfu, umfangsmiklum rangfærsluherferðum eða bilun í iðnaðar‑AI kerfum. Stuðningur OpenAI er fyrsta áberandi stuðningur við tillöguna; Anthropic, annar leiðandi rannsóknarstofnun, hefur opinberlega mótmælt henni og varað við því að almenn verndarregla gæti minnkað ábyrgð og látið fórnarlömb vera án réttinda. Aðilar leggja áherslu á að lagaleg skýrleiki myndi hvetja til áframhaldandi fjárfestinga í háþróaðri gervigreind, sem í dag stendur frammi fyrir flóknum lögum á ríkisstigi og ógn við eyðileggjandi dóma. Gagnrýnendur svara því að skjaldarmerkið gæti skapað siðferðilegan áhættuþátt, þar sem fyrirtæki gætu látið ábyrgð á öryggisprófunum og áhættustýringu á hendur stjórnvalda eða endanotenda. Lögin koma í kjölfar fjölsins af löggjafarverkefnum sem miða að gervigreind, frá umræðum Pentagon um örugga sérsniðna örgjörva til alríkissamtaka um ábyrgðarumhverfi. Ef lögin eru samþykkt, verður Illinois prófunarstaður fyrir takmarkaða fyrirtækjaöryggisvörn sem gæti haft áhrif á aðrar lögsögu. Hagsmunaaðilar munu fylgjast með atkvæðagreiðslu senatunnar, mögulegum breytingum sem gætu þrengt um svið ónæmda og öllum lagalegum ágreiningi sem neytendaverndarsamtök gætu sett fram. Jafnframt verður svar frá öðrum AI-veldi – hvort þau standi með OpenAI eða fylgi Anthropic – og hvernig bandarískir stjórnendur samræma ríkis‑stigs verndarreglur við nýlegar alríkisáætlanir um AI-eftirlit.
26

Fólk sem reynir að stjórna LLM eru bara W40K Tech‑Priest sem biður Machine Spirit um að senda tótt. #

Mastodon +6 heimildir mastodon
Víruset innlegg á X í þessari viku kveikti nýjan umfjöllunarmynd um hvernig tæknifyrirtækið reynir að „tæma“ stór tungumálalíkön (LLM). Skilaboðin, sem AI‑útskýrandi Mikael Sundberg birti, líkir nútíma tilraunum til stjórnunar LLM við Warhammer 40 K tæknapríst sem syngur til Vélahimnunnar: „Fólk sem reynir að stjórna LLM eru bara W40K tæknaprístur sem biðja Vélahimnuna. Send toot.“ Þessi léttir, en íkveikandi samanburður safnaði fljótt þúsundum like- og endurdeilinga og flóð af athugasemdum frá rannsakendum, siðfræðingum og áhugafólki um allan heim. Samanburður Sundbergar snertir djúpa menningarlegan spennu. Á annarri hlið eru fyrirtæki og stjórnendur að setja upp öryggisramma – API‑kerfi til síun spurninga, endurskoðanir á notkunarstefnu og nýlegar ákvæðingar í „AI Act“ – til að tryggja að gerandi gervigreind samræmist samfélagslegum gildum. Á hinni hliðinni halda forritarar því fram að slíkar aðgerðir líti oft út eins og rituð trúarlegar hefðir frekar en raunveruleg verkfræði, tilfinning sem speglast í Warhammer‑sögunni þar sem Adeptus Mechanicus telur að hver bilun sé óánægð Vélahimna sem þarf að friða með helgisiðum. Af hverju er þessi líking mikilvæg? Tvöfalt. Fyrst og fremst kristallísar hún vaxandi óánægju með það að ofstefna stjórn gæti hamlað nýsköpun án þess að takast á við raunveruleg tæknileg vandamál í tengingu og útskýranleika. Í öðru lagi umbreytir memedrifin rammi opinberum umræðum, breytir tæknilegri stefnumótun í menningarlega frásögn sem nær til breiðari, óteknískra áhorfenda. Með því að vísa í ástsælt vísindaskáldsagnaverk dregur innleggið niður hindrunina fyrir almenning að takast á við flókin öryggismál í AI. Það sem á að fylgjast með næst eru áhrifin á stefnumótun og framtíðaráætlanir iðnaðarins. Ráðgjöf Evrópusambandsins um AI‑lögin, sem á að vera tilbúin seinna í þessum mánuði, gæti vísað
26

Leiðandi líkön eru nú „næstum ógreinanleg“ frá hvoru öðru þegar kemur að frammistöðu

Mastodon +6 heimildir mastodon
Ný skýrsla frá Stanford Institute for Human‑Centered Artificial Intelligence (HAI) sýnir að frammistöðuá milli heimsins leiðandi tungumálalíkana hefur í raun horfið. Í fjölda viðmiðunartækja skora OpenAI‑GPT‑4‑Turbo, Anthropic‑Claude 3, Google‑Gemini 1.5 og fjölmörg opin líkön eins og Llama 3 og Mistral‑7B innan nokkurra prósentustiga frá hvoru öðru. Rannsóknin lýsir þessu fyrirbæri sem „næstum ógreinanleika“ og bendir á að opin líkön séu nú „samkeppnishæfari en nokkru sinni fyrr“ og að þau stefni í átt að sömu getu‑mörkum. Samanburðurinn er mikilvægur vegna þess að hann rofar upp hefðbundna vopnabaráttuna sem byggðist á hráum getu. Þegar hráar niðurstöður greina ekki lengur milli birgja, færist keppniskrafturinn í átt að aukaatriðum: útreikningskostnaður, tafartími, sveigjanleiki í fínstillingu, öryggistól, og læsingu í vistkerfinu. Fyrir fyrirtæki þýðir það breiðara úrval valkosta og möguleikann á að skipta út eigendarsniðnum API fyrir opið líkön án þess að fórna frammistöðu. Fyrir iðnaðinn er líklegt að keppnin skerist um reikniritun, verðmódel og ábyrgðar‑AI vottanir frekar en um áberandi getuuppfærslur. Eins og við skýrðum 17. apríl, bentu endurgerð okkar á Mythos‑niðurstöðum Anthropic með opinberum líkönum þegar á milli lína á að minnka bilið; Stanford‑skýrslan staðfestir að þróunin sé nú kerfisbundin. Næstu mánuðir munu sýna hvernig fyrirtæki bregðast við. Fylgist með útgáfu næstu kynslóða opinna líkans, verðlagningarbreytingum frá skýjaþjónustuaðilum og nýjum viðmiðunarsöfnum eins og HELM 2.0 sem miða að því að mæla kostnaðar‑ og öryggismælikvarða. Reglugerðarstofnanir eru einnig að vænta að leggja áherslu á gagnsæi og samræmingarstaðla, og breyta þessum skilyrðum í nýja keppniskröfur á markaði þar sem hrá frammistaða er ekki lengur aðgreiningarþátturinn.
26

Wei Ping (@_weiping) á X

Mastodon +6 heimildir mastodon
deepseek
Kínverskt gervigreindarlab Zhipu AI hefur gefið út tækniskýrslu um nýjustu stórt tungumálalíkanið sitt, GLM‑5, og skjalinu er þegar lýst sem áhrifamestu greiningunni síðan DeepSeek‑V3/R1. Skýrslan, sem NVIDIA-virðulegur rannsakandi Wei Ping dregur fram á X, lýsir ýmsum nýjungum í athyglis‑skilvirkni—þar á meðal blönduðu skilvirku‑athyglisafbrigði, þunnt athyglismynstur og renna‑glugga‑aðferð—sem eru studdar af umfangsmiklum afleiðslu‑prófanir og frammistöðumat. Mikilvægi málsins felst í því að líkanið getur skilað sambærilegri eða betri ruglingsstuðul (perplexity) en samtímaliðir, á sama tíma og það minnkar minni- og reikniverkun um allt að 40 % . Slíkar ábætur takast á við vaxandi kostnað við þjálfun og þjónustu margra milljarða færða líkana, hindrun sem hefur dregið úr útbreiðslu utan vel fjármagnaðra skýjaþjónustuaðila. Með því að birta nákvæmar tilraunargögn veitir GLM‑5‑teymið rannsóknaumhverfinu endurtekna innsýn sem gæti flýtt fyrir innleiðingu þunnts og staðbundins athyglis í gegnum LLM‑vistkerfið. Stuðningur Wei Ping er mikilvægur: hans vinna hjá NVIDIA snýst um vélbúnaðar‑vitt aðlögun líkana, og opinber loforð hans bendir til þess að tæknin í GLM‑5 sé samrýman við nýja H100‑samrýma hugbúnaðarpakkan NVIDIA. Ef niðurstöðurnar breytast í opinn kóða eða samþættingu við NVIDIA TensorRT‑LLM, gætu þróunaraðilar séð tafarlausa frammistöðubætur á núverandi innviðum. Það sem þarf að fylgjast með næst er formleg útgáfa GLM‑5‑þyngdar, væntanlegar frammistöðumat á HELM‑ og MMLU‑prófunasöfnum, og möguleg samstarfsauglýsingar milli Zhipu AI og vélbúnaðaraðila. Jafnframt verður mikilvægt að fylgjast með eftirfylgjandi greinum sem kanna hvernig skýrt athyglisafbrigðinu er hægt að stækka í trilljón‑færða umhverfi, skref sem gæti umbreytt samkeppnislandslaginu milli kínverskra og vestrænna LLM‑þróunaraðila.
26

Tinder og Zoom bjóða upp á “sönnun á mannlegu” augnaskönnun til að berjast gegn gervigreind

Mastodon +6 heimildir mastodon
Tinder og Zoom hafa tilkynnt að þeir muni innleiða augnaskönnunartækni í vettvangana sína sem “sönnun á mannlegu” aðgerð til að draga úr svikum og virkni gervigreindar‑gerðra persónuskipta og róbóta. Þessi eiginleiki, sem er áætlaður í takmarkaða beta útgáfu seinna á þessu fjórðungi, tekur upp fljótlegan skönnun á netkerfismynstur í gegnum myndavélina á tækinu og ber það saman við ör
24

Shapley-gildi-stýrð aðlögunarmyndunarnám til útskýranlegrar fjármálasvikagreiningar með

ArXiv +5 heimildir arxiv
Shapley Value‑stýrð aðlögunarleg samsetningarnám til útskýrandi
24

Gmail‑merkingabrúin á Claude Cowork brást nýlega

HN +6 heimildir hn
claudegooglegpt-5reasoning
Claude Cowork’s Gmail‑merkingabrú er orðinn óvirkur og hefur skilið þúsundum notenda í ómöguleika að samstilla tölvupóstmerkingar með AI‑drifnu vinnusvæðinu. Bilunin kom í ljós snemma á þriðjudaginn þegar samþættingin, sem sjálfkrafa speglar Gmail‑merkingar sem verkefnamörk Claude‑Cowork, byrjaði að skila 502 villum. Anthropic staðfesti bilunina á stöðusíðu sinni og útskýrði að hún stóðst vegna nýrrar breytingar á Gmail API Google, sem braut við auðkenningaráferðina sem brúin notar. Villan er mikilvæg vegna þess að brúin er hornsteinn í loforði Claude Cowork um að breyta venjulegum innhólmum í samvinnu‑vitneskapsgrunn. Með því að draga merkingagögn inn í samhengi Claude getur kerfið birt viðeigandi þræði, lagt til næstu skref og fært líkanið nýjustu upplýsingarnar án handvirkrar afritunar. Fyrirtæki sem hafa byggt innri vinnuferla um þessa sjálfvirkni standa nú frammi fyrir tafir í miða‑flutningi, seinkunum í samþykktum og skyndilegri þörf á handvirkum ferlum. Með 2 milliár notendum Google er jafnvel sértæk bilun í raun áhrif á breiðari AI‑afkasta markaðinn og sýnir hversu náið nútíma vinnutól eru háð stöðugum API frá þriðju aðila. Anthropic hefur lofað flýtileiðrétting innan 48 klukkustunda og er að setja inn varasöm OAuth‑tókunakerfi til að verja gegn framtíðarbreytingum á API. Áhorfendur munu fylgjast með því hversu fljótt lagfæringin endurheimtir fulla merkingasamstillingu og hvort Google muni skerpa á tilkynningastefnu um API‑breytingar, skref sem gæti neyðað aðrar AI‑vettvangslausnir endurhönnuðu sambærilega tengi. Atvikið endurlýsir einnig umræður sem vaknaði í kjölfar fyrri umfjárðar okkar um Claude Opus og Claude Code útgáfur Anthropic, og varpar ljósi á jafnvægið milli öflugra, samhengi‑ríkra líkana og viðkvæmni límmiðilsins sem bindur þau við daglegt hugbúnað. Næstu dagar munu sýna hvort Claude Cowork geti endurheimt traust eða hvort notendur snúi sér að þolnari, sjálfhýstum lausnum.

Allar dagsetningar