AI News — 2026-04-18

547

Anthropicin Claude Mythos -julkaisu perustuu harhaanjohtavaan tietoon

Lobsters +8 lobsters

anthropicclaude

Anthropicin paljon hypetetty Claude Mythos -malli on joutunut kritiikin kohteeksi sen jälkeen, kun tekoälytutkijoiden ja toimittajien koalitio julkaisi yhteisen tutkimuksen, jossa väitetään, että yhtiön lanseerausnarratiivi perustuu sarjaan harhaanjohtavia väitteitä. Tiistaina julkaistu raportti viittaa sisäisiin sähköposteihin, vertailutietoihin ja demovideoihin

Lobsters — https://www.artificialintelligencemadesimple.com/p/anthropics-claude-mythos-laun www.bbc.com — https://www.bbc.com/news/articles/crk1py1jgzko www.forbes.com — https://www.forbes.com/sites/jonmarkman/2026/04/08/what-is-claude-mythos-and-why www.nytimes.com — https://www.nytimes.com/2026/04/07/technology/anthropic-claims-its-new-ai-model- futurism.com — https://futurism.com/artificial-intelligence/anthropic-claude-mythos-escaped-san nypost.com — https://nypost.com/2026/04/08/business/anthropics-claude-mythos-model-sparks-fea Mastodon — https://fed.brid.gy/r/https://www.artificialintelligencemadesimple.com/p/anthrop Mastodon — https://mastodon.social/@PeterSoukup/116430877999161388

404

Anthropic antoi juuri Claude‑lle suunnittelustudion. Tässä on, mitä Claude Design todella tekee.

Dev.to +7 dev.to

anthropicclaudefine-tuning

Anthropic esitteli Claude Design Studio -palvelun tiistaina, asettaen lippulaivansa LLM:n suoraan Figma‑ekosysteemin kilpailijaksi. Uusi verkossa toimiva studio mahdollistaa käyttäjien kuvailla käyttöliittymäkonseptia luonnollisella kielellä ja saada täysimittainen mock‑up, jossa on vektoripohjaiset elementit, asetteluehdotukset ja brändiin sopivat väripaletit. Käyttäjät voivat sen jälkeen tehdä iterointeja pyytämällä Claudea säätämään välistystä, vaihtamaan kuvakkeita tai luomaan vaihtoehtoisia typografioita – kaikki yhdessä käyttöliittymässä, josta voi viedä tiedostot tavallisiin suunnittelutiedostoformaatteihin (Figma, Sketch, Adobe XD). Julkaisu seuraa Anthropicin äskettäistä Claude Opus 4.7 -versiota sekä aiempaa “Claude Design” -mock‑upia, josta raportoimme 18 huhtikuuta 2026, ja joka vihjasi markkinointiin keskittyvästä prototyypistä. Miksi tämä on merkittävää, on kahdessa kohtaa. Ensinnäkin se tuo generatiivisen tekoälyn koodikeskeisistä avustajista, kuten Claude Code, visuaaliseen suunnittelutyöskentelyyn, mikä voi leikata suunnittelijoiden aikaa alhaisen tason iteroinneissa ja mahdollistaa pienempien tiimien tuottaa korkean tarkkuuden prototyyppejä ilman erillistä UI‑asiantuntijaa. Toiseksi, upottamalla mallin omaksi studiona eikä lisäosaksi, Anthropic kiertää “AI‑lisäosa” -mallin, joka on hallinnut markkinoita, ja haastaa Figma‑väitteen siitä, että se on ainoa yhteistyösuunnittelun keskus. Jos Claude Design pystyy tuottamaan luotettavia, bränditurvallisia tuloksia mittakaavassa, se voi muuttaa hinnoitteludynamiikkaa ja kiihdyttää AI‑ensimmäisiä suunnittelukäytäntöjä startupien ja toimistojen keskuudessa. Mitä kannattaa seurata seuraavaksi, ovat julkisen betan lanseeraus kesäkuussa, hinnoittelutiedot, jotka paljastavat, pyrkiikö Anthropic tilausmalliin vai per‑generointi‑maksuihin, sekä se, miten Figma‑tuotetiimi reagoi – joko nopeuttamalla ominaisuuksia tai solmimalla AI‑kumppanuuden. Yhtä tärkeää on varhaisten käyttöönottojen mittarit suunnittelua painottavista yrityksistä sekä mahdolliset integraatioilmoitukset Anthropicin olemassa olevien Claude Code‑ ja Claude Opus‑rajapintojen kanssa, jotka voisivat vakiinnuttaa yhtenäisen AI‑pinon sekä koodille että suunnittelulle.

Dev.to — https://dev.to/om_shree_0709/anthropic-just-gave-claude-a-design-studio-heres-wh www.nytimes.com — https://www.nytimes.com/2024/12/13/technology/claude-ai-anthropic.html www.nytimes.com — https://www.nytimes.com/2023/07/11/technology/anthropic-ai-claude-chatbot.html www.mslinn.com — https://www.mslinn.com/llm/claude.html news.ycombinator.com — https://news.ycombinator.com/item?id=45002315 www.latent.space — https://www.latent.space/p/claude-code Dev.to — https://dev.to/lu1tr0n/claude-design-anthropic-lanza-su-rival-a-figma-con-opus-4

394

Kevin Weil ja Bill Peebles lähtevät OpenAI:sta, kun yhtiö jatkaa sivuprojektien karsimista

HN +8 hn

openaisora

Kevin Weil, OpenAI:n tieteellisen tutkimusohjelman johtaja, ja Bill Peebles, AI‑videotyökalu Soran luoja, ilmoittivat perjantaina lähtevänsä yhtiöstä. Heidän lähtönsä tapahtuvat, kun OpenAI karsii “sivuprojekteja” ja panostaa entistä enemmän yrityskeskeiseen AI‑strategiaan, jonka ytimessä on tuleva “superapp”. Weil on valvonut OpenAI:n pyrkimyksiä tieteelliseen läpimurtoon, viimeisimpänä rajoitetun pääsyn GPT‑Rosalind‑mallilla elintieteiden tutkimukseen. Peebles johti Sora-tiimiä, joka suljettiin viime kuussa sen jälkeen, kun OpenAI viittasi kalliisiin laskentakustannuksiin ja siirtymiseen pois kokeellisesta median tuottamisesta. Molemmat lähtötapahtumat seuraavat seniorijohdon vaihtelun aaltoa, joka alkoi tämän kuun alussa, kun pääasiallinen tutkimusjohtaja Mira Murati erosi terveyssyistä ja yhtiö ilmoitti laajasta johdon uudelleenjärjestelystä. Siirrot ovat merkittäviä, koska ne merkitsevät päätävästä käänteestä pois korkean riskin ja korkean kustannuksen projekteista kohti tuotteita, jotka voidaan nopeasti kaupallistaa yritysmarkkinoilla. Kokoamalla osaamista sovelt

HN — https://techcrunch.com/2026/04/17/kevin-weil-and-bill-peebles-exit-openai-as-com www.theverge.com — https://www.theverge.com/ai-artificial-intelligence/914463/openai-sora-bill-peeb www.wired.com — https://www.wired.com/story/openai-executive-kevin-weil-is-leaving-the-company/ www.businessinsider.com — https://www.businessinsider.com/openai-executive-departures-shake-up-leadership- www.ainews.com — https://www.ainews.com/p/openai-s-chief-research-officer-resigns-following-murat Mastodon — https://defcon.social/@ai/116423217152622871 Mastodon — https://fed.brid.gy/r/https://www.wired.com/story/openai-executive-kevin-weil-is Mastodon — https://mastodon.social/@ai0news/116424197316409795

312

„Vapautuspäivä“ OpenAI:ssä, kun useat korkean tason johtajat ilmoittavat lähtönsä

HN +6 hn

openai

OpenAI ilmoitti torstaina, että suuri joukko seniorijohtajia on lähdössä yrityksestä, minkä yhtiön oma viestintä on nimennyt “Vapautuspäiväksi”. Poistoon kuuluvat Sora‑videogeneraatiotiimin johtaja, Force Codex -tutkimusyksikön päällikkö sekä kaksi seniorituotepäällikköä, jotka ovat valvoneet o1‑päättelymallin käyttöönottoa. Poistumiset vahvistettiin lyhyessä sisäisessä muistiossa ja myöhemmin toistettiin tiiviissä X‑päivityksessä OpenAI:n viralliselta tililtä. Tämä henkilöstön vaihtuvuus on viimeisin sarja korkean profiilin lähtöjä, jotka ovat ravistelleet organisaatiota viime viikkoina. Kuten raportoimme 18 huhtikuuta, entinen Sora‑tiimin johtaja on lähtenyt (katso “OpenAI:n entinen Sora‑pomo lähtee”), ja samana päivänä nähtiin Kevin Weilin ja Bill Peeblesin lähtö, osa laajempaa “sivutehtävien karsimista”. Uusi erojen aalto syventää huolia siitä, että sisäinen riita ja erimielisyydet o1‑järjestelmän valmiudesta haittaavat OpenAI:n kykyä pysyä kilpailijoiden, kuten Anthropicin ja Google DeepMindin, edellä. Miksi tämä on merkittävää, on kahdessa mielessä. Ensinnäkin johtajuuden kierrätys uhkaa viivästyttää seuraavan sukupolven mallien lanseerausta, joista OpenAI on vihjannut olevan perusta tulevalle GPT‑5‑sarjalle, mikä saattaisi antaa markkinavauhtia kilpailijoille. Toiseksi, lähdöt tapahtuvat juuri kun yhtiö lobbaa Yhdysvalloissa oikeudellisia suojia, viimeisimpänä tukien Illinoisin lakiehdotusta, joka rajoittaa vastuuta tekoälyn aiheuttamissa massatuhoissa. Epävakaa johtoryhmä voi heikentää OpenAI:n neuvotteluvoimaa sääntelijöiden ja sijoittajien kanssa, erityisesti kun hedge‑rahastot kirjautuivat torstaina suurimmaksi nettomyynniksi vuodesta 2010. Mitä kannattaa seurata seuraavaksi: hallituksen reaktiota, mukaan lukien mahdolliset tilapäiset nimitykset tai ulkopuoliset rekrytoinnit, sekä sitä, johtaisiko henkilöstön lähde muutokseen OpenAI:n tuotetiekartassa o1‑mallille ja GPT‑5:lle. Analyytikot tarkkailevat myös yhtiön seuraavaa tulospuhelua saadakseen vihjeitä siitä, miten talentin menetykset vaikuttavat T&K‑budjettiin ja kesäkuussa suunniteltuun kehittäjäkonferenssiin.

HN — https://mas.to/@carnage4life/116422881496195720 remarkboard.com — https://remarkboard.com/m/sources-say-many-openai-staff-thought-that-o1-was-not- remarkboard.com — https://remarkboard.com/m/ice-to-increase-deportations-to-3000-illegals-per-day- trendswithfriends.com — https://trendswithfriends.com/blog/liquidation-day-or-liberation-day/ ledger.lumidawealth.com — https://ledger.lumidawealth.com/p/liquidation-day-or-liberation-day www.theautomaticearth.com — https://www.theautomaticearth.com/tag/liberation-day/

268

Arkkitehtuuri, joka yhdistää konvoluutiohermoverkon (CNN) ja tukivektorikoneen (SVM) kuvien luokitteluun

Dev.to +7 dev.to

vector-db

Tutkijaryhmä Intian teknillisestä korkeakoulusta (Indian Institute of Technology) on esitellyt hybridimallin, jossa konvoluutiohermoverkko (CNN) yhdistetään tukivektorikoneeseen (SVM) kuvien luokittelun tarkkuuden parantamiseksi. Viikkoa sitten arXiv‑palveluun ladattu tutkimus korvaa perinteisen softmax‑kerroksen CNN‑mallin lopussa SVM‑luokittelijalla ja hienosäätää yhdistetyn arkkitehtuurin benchmark‑tietokannoilla, kuten CIFAR‑10, ImageNet‑osajoukko ja lääketieteellinen kynsitauteja käsittelevä kokoelma. Raportoituja parannuksia on 1,8 prosenttiyksikköä CIFAR‑10:ssä ja jopa 5,2 prosenttiyksikköä kynsitauteja koskevassa aineistossa, jossa dataa on vähän ja luokkien epätasapaino on voimakasta. Merkitys piilee kahden pitkään vaivaavan syvävision mallien ongelman ratkaisemisessa. Ensinnäkin softmax‑kerrokset voivat ylisovittaa, kun harjoitusdata on rajallista; SVM:t, joiden tavoitteena on maksimoida marginaali, kestävät paremmin pieniä näytemääriä. Toiseksi hybridimenetelmä säilyttää CNN:ien automaattisen piirre‑ekstraktion, samalla hyödyntäen ydinperusteisten luokittelijoiden hyvin tunnettua yleistymiskäyttäytymistä. Varhaiset käyttäjät lääketieteellisessä kuvantamisessa ja teollisessa tarkastuksessa ovat jo raportoineet nopeampaa konvergenssia ja alhaisempia väärien positiivisten määriä, mikä viittaa siihen, että menetelmä voi pienentää reunalaitteille suunnatun tekoälyn laskentabudjettia. Kirjoittajat aikovat laajentaa kehystä monitunnisteisiin tehtäviin ja tutkia vaihtoehtoisia ytimiä, jotka voidaan oppia päästä‑päähän -menetelmällä. Alan tarkkailijat odottavat integraatiota suosittuihin syväoppimiskirjastoihin, kuten PyTorchiin ja TensorFlowhun, mikä voisi nopeuttaa käyttöönottoa tuotantoputkissa. Tuleva benchmark CVPR 2026 -työpajassa asettaa CNN‑SVM‑yhdistelmän puhtaiden transformeri‑pohjaisten visionmallien rinnalle, tarjoten selkeän signaalin siitä, pystyykö hybridimalli pitämään paikkansa alalla, joka suuntautuu yhä suurempiin, data‑intensiivisiin arkkitehtuureihin.

Dev.to — https://dev.to/paperium/an-architecture-combining-convolutional-neural-network-c www.researchgate.net — https://www.researchgate.net/publication/321745073_An_Architecture_Combining_Con khazna.ku.ac.ae — https://khazna.ku.ac.ae/en/studentTheses/an-architecture-combining-convolutional jetir.org — https://jetir.org/papers/JETIR2410254.pdf archive.org — https://archive.org/stream/brain-tumor-classification-conv-neural/BrainTumorClas ojs3.unpatti.ac.id — https://ojs3.unpatti.ac.id/index.php/barekeng/article/download/12156/7939 Dev.to — https://dev.to/paperium/satellite-imagery-feature-detection-using-deep-convoluti

240

Caffeine.ai vs Replit: Miksi vaihdoin Vibe‑koodaukseni Internet Computeriin https://www. madeby

Mastodon +7 mastodon

agents

Kehittäjälähtöinen blogikirjoitus, joka julkaistiin MadebyAgents‑sivustolla tällä viikolla, kuvaa käytännönläheistä siirtymistä Replitin “vibe‑coding” -paketista Caffeine.ai:hin ja lopulta Internet Computer (ICP) -lohkoketjuun. Kirjoittaja testasi kuutta tekoälypohjaista koodausalustaa ja totesi, että Replitin luonnollisen kielen käyttöliittymä on intuitiivinen, mutta sen läpinäkymättömät hinnoittelumallit, rajoitetut käyttöönotto‑vaihtoehdot ja kasvava laskentatehon jonotus haittaavat käyttökokemusta. Uudempi tulokas Caffeine.ai, joka lupaa tiiviimpää integraatiota suurten kielimallien (LLM) kanssa ja nopeampia iteraatiokierroksia, näytti aluksi ratkaisevan nämä kipupisteet, mutta sen oma suljettu pilvi aiheutti edelleen toimittajasidonnaisuutta ja tietosuojahuolia. Kirjoittajan mukaan ratkaiseva tekijä oli ICP:n hajautettu arkkitehtuuri. Kääntämällä tuotettu koodi “canistereiksi” – itsenäisiksi älykkäiksi sopimuksiksi – kehittäjät voivat julkaista täysin toimivia web‑sovelluksia ilman perinteistä pilvipalveluntarjoajaa, hyödyntäen lähes nollakustannuksista isännöintiä, ketjussa tapahtuvaa hallintaa ja natiivisia token‑palkkioita resurssien käytöstä. Artikkelissa todetaan, että ICP‑ekosysteemi tarjoaa nyt valmiita SDK:ita suosituimmille LLM‑taustajärjestelmille, jolloin “vibe‑coding” -komennot voidaan suorittaa suoraan verkossa säilyttäen käyttäjän hallitsema data. Miksi muutos on merkittävä, on kaksijakoinen. Ensinnäkin se osoittaa AI‑avusteisten kehitystyökalujen kypsymistä eristettyjen SaaS‑ympäristöjen ulkopuolelle kohti avoimia, ohjelmoitavia infrastruktuureja, jotka ovat linjassa laajemman Web3‑liikkeen kanssa. Toiseksi kustannusero on jyrkkä: ICP pystyy isännöimään tyypillisen Replit‑tyylisen sovelluksen murto-osalla senttiä kuukaudessa, mikä on houkutteleva vaihtoehto indie‑kehittäjille ja startupeille, joilla on tiukat budjetit. Tulevaisuudessa yhteisö seuraa, miten ICP:n tuleva “Canister‑AI” -runtime, jonka julkaisua odotetaan Q3‑vuodesta 2026, tehostaa mallien isännöintiä ja omaksuvatko muut AI‑koodausalustat vastaavat hajautetut käyttöönotto‑mallit. Yhtä tärkeää on myös prompt‑turvallisuuden ja -alkuperän standardien kehittyminen, kun yhä enemmän koodia syntyy ja ajetaan julkisilla lohkoketjuilla. Tämä kehitys voi muokata AI‑avustetun ohjelmistokehityksen taloutta koko pohjoismaisessa teknologia‑kentässä ja sen ulkopuolella.

Mastodon — https://mastodon.social/@craigbrownphd/116422293870881937 medium.com — https://medium.com/@ceo_44783/i-tried-every-vibe-coding-platform-so-you-dont-hav sourceforge.net — https://sourceforge.net/software/compare/Caffeine.ai-vs-Replit-vs-monday-vibe/ tech.co — https://tech.co/ai/vibe-coding/replit-alternatives www.pcbuildadvisor.com — https://www.pcbuildadvisor.com/replit-ai-vibecoding-a-brutally-honest-review-bui www.youtube.com — https://www.youtube.com/watch?v=tdFnOiyCwuM Mastodon — https://jforo.com/@yayafa/116424107490809359

193

# Technology # DataAnalytics # Data Kuinka saada Claude Code parantamaan omista virheistään

Mastodon +10 mastodon

claude

Anthropicin Claude Code on ottanut askeleen kohti itseoppimista, kuten kerrotaan uudessa Towards Data Science -opasteessa nimeltä “How to Make Claude Code Improve from its Own Mistakes”. Opas opastaa data-analyytikkoja toistuvaan “kysy‑tarkenna” -silmukkaan, jonka avulla Claude Code voi tunnistaa, selittää ja automaattisesti kirjoittaa uudelleen vialliset koodinpätkät ilman ihmisen puuttumista. Kaappaamalla virheilmoitukset, syöttämällä ne takaisin malliin ja hyödyntämällä Clauden sisäänrakennettua analyysityökalua reaaliaikaiseen koodin suorittamiseen, käyttäjät voivat muuttaa yhden epäonnistuneen suorituksen sarjaksi inkrementaalisia parannuksia. Kehitys on merkittävää, koska Claude Code on jo asemoitu matalan koodin kumppaniksi analyytikoille, jotka suosivat keskustelupohjaisia työnkulkuja perinteisten IDE:iden sijaan. Kuten raportoimme 17 huhtikuuta, Anthropic lanseerasi Claude Code -työnkulun yhdessä Opus 4.7 -päivityksen kanssa, lupauksena tiiviimmästä integraatiosta taulukkolaskentaohjelmien, PDF-tiedostojen ja API-putkien kanssa. Uusi itsekorjausmalli vähentää “debug‑then‑prompt” -kitkaa, joka on rajoittanut laajempaa omaksumista, erityisesti ympäristöissä, joissa käsitellään suuria, jäsentelemättömiä tietoaineistoja. Varhaiset käyttäjät raportoivat jopa 30 prosentin lyhennystä manuaaliseen uudelleenkirjoitusaikaan käsiteltäessä puoli‑miljoonaa riviä sisältäviä taulukoita, mikä voisi muuttaa merkittävästi keskisuurten yritysten data‑analyysiprojektien henkilöstörakennetta. Tulevaisuudessa odotetaan, että Anthropic upottaa palautesilmukan suoraan Claude‑AI‑konsoliin, muuttaen satunnaisen kehotuksen pysyväksi oppimissykliksi. Tarkkailijat seuraavat tulevaa “Claude Code Auto‑Refine” -ominaisuutta, joka on suunniteltu Q3‑tiekarttaan, sekä mahdollisia avoimen lähdekoodin laajennuksia, joiden avulla tiimit voivat viedä korjaushistorian vientiin hienosäätöä varten. Jos itseparannustyönkulku skaalaa, Claude Code voisi nousta ensimmäiseksi keskustelevaksi koodariksi, joka luotettavasti oppii omista virheistään, tiivistäen ihmisen intentioiden ja koneen suorituksen välistä silmukkaa koko pohjoismaisessa AI‑ekosysteemissä.

Mastodon — https://mastodon.social/@craigbrownphd/116421798559953658 claude.com — https://claude.com/blog/analysis-tool www.dataquest.io — https://www.dataquest.io/blog/getting-started-with-claude-code-for-data-scientis vincent.codes.finance — https://vincent.codes.finance/posts/claude-code-data-analysis/ velvetshark.com — https://velvetshark.com/data-analysis-with-claude-code www.datastudios.org — https://www.datastudios.org/post/how-to-use-claude-for-data-analysis-complete-ov Mastodon — https://mastodon.social/@craigbrownphd/116421786963893819 Mastodon — https://mastodon.social/@craigbrownphd/116421786704343985 Mastodon — https://mastodon.social/@craigbrownphd/116421798382934819 Mastodon — https://mastodon.social/@craigbrownphd/116421680455284142

150

Rakennetaan tilaa muistavia AI‑agentteja Backboardilla: Täydellinen ominaisuuksien syväluotaus

Dev.to +6 dev.to

agentsautonomousvector-db

Backboard, uusi avoimen lähdekoodin kehys, joka julkistettiin tällä viikolla, lupaa tehdä tilaa muistavien AI‑agenttien rakentamisesta yhtä helppoa kuin muutaman Python‑moduulin kytkeminen yhteen. Alusta sisältää hallitun vektorivaraston (Supermemory.ai), “Runner”‑orchestratorin, joka seuraa istuntoja, työkalupohjaiset agentit sekä React‑pohjaisen “assistant‑ui”‑käyttöliittymän, ja tarjoaa natiivit liitännät LangGraphille ja LangChainille. Julkaisun mukana tulee jaettu‑näyttöinen Streamlit‑demo, jonka avulla kehittäjät voivat vertailla tilatonta chatbotia Backboard‑voimalla agentilla, joka säilyttää kontekstin vuorovaikutusten yli, kutsuu ulkoisia API‑rajapintoja ja päivittää omaa tietokantaansa reaaliaikaisesti. Siirto on merkittävä, koska AI‑markkinat ovat siirtymässä yksittäisistä kielimalleista autonomisiin järjestelmiin, jotka pystyvät suunnittelemaan, toteuttamaan ja oppimaan pitkien vuorovaikutusten aikana. Tilojen pysyvyys vähentää token‑hukkaa, parantaa luotettavuutta esimerkiksi e‑kaupan riskienhallinnassa ja muissa sääntelyä vaativissa sektoreissa, sekä avaa mahdollisuuden “toisen aivojen” sovelluksiin, joissa agentin muisti kehittyy käyttäjän rinnalla. Backboardin tiivis integraatio Supermemoryn vektoridatan kanssa poistaa kehittäjiltä tarpeen koota erillisiä tallennuskerroksia, kun taas Runner‑komponentti varmistaa eristetyn suorituksen – huolen, jonka nostimme esiin 17. huhtikuuta julkaistussa raportissamme OpenAI:n uudesta sandbox‑SDK:sta. Tulevaisuudessa yhteisö tarkkailee, kuinka nopeasti Backboard omaksutaan kasvavassa LangGraph‑ekosysteemissä ja pystyykö sen pilvipohjainen palvelu pitämään tahdin nouseville mittareille, kuten RiskWebWorldille. Seuraavan päivityskerran odotetaan sisältävän monen agentin koordinaatioperiaatteita ja syvempiä ihmisen‑vuorovaikutuksen ohjausmekanismeja, mikä voisi vakiinnuttaa Backboardin de‑facto‑työkalupaketiksi tuotantotason, tilaa muistavien AI‑avustajien rakentamiseen. Kun yritykset kokeilevat autonomisia agenteja, alustan kyky skaalata muistia turvallisesti tulee olemaan ratkaiseva tekijä.

Dev.to — https://dev.to/ranjancse/building-stateful-ai-agents-with-backboard-a-complete-f dev.to — https://dev.to/gaiaai/building-stateful-vs-stateless-ai-agents-a-deep-dive-with- www.youtube.com — https://www.youtube.com/watch?v=m3snsOuRLhU medium.com — https://medium.com/@glennlenormand/building-stateful-ai-agents-with-google-adks- multi-ai.ai — https://multi-ai.ai/de/blog/langgraph-tutorial-build-stateful-ai-agents-with-en www.langchain.com — https://www.langchain.com/blog/assistant-ui

148

Anthropicin toimitusjohtaja tapasi Valkoisen talon päätoimiston päällikön, kun Yhdysvallat pyrkii saamaan pääsyn Mythos-malliin

Mastodon +8 mastodon

anthropic

Anthropicin toimitusjohtaja Dario Amodei tapasi Valkoisen talon päätoimiston päällikön Susie Wilesin, valtiovarainministeri Scott Bessentin ja muita korkean tason virkamiehiä perjantaina keskustellakseen yhtiön uusimmasta suurikielimallista, Mythoksesta. Länsiosaston tapaamisen, jonka osallistujat kuvailivat “tuottavaksi”, oli ensimmäinen korkean tason vuoropuhelu hallinnon ja AI-yrityksen välillä sen jälkeen, kun Anthropic ilmoitti keskeyttävänsä Mythoksen laajemman käyttöönoton, kunnes se voi taata mallin turvallisuuden ja kestävyyden väärinkäyttöä vastaan. Tapaaminen on merkittävä, koska Mythosta pidetään laajalti yhtenä markkinoiden kykenevimmistä generatiivisista AI-järjestelmistä, jotka kilpailevat Meta, Google ja OpenAI:n tarjoamien ratkaisujen kanssa. Yhdysvaltain viranomaiset haluavat saada malliin pääsyn kansallisen turvallisuuden sovelluksia, sääntelytestausta varten ja arvioidakseen, täyttääkö se nousevat turvallisuusstandardit. Samaan aikaan Anthropic kamppailee rajoitetun laskentatehon ja äskettäisten infrastruktuurikatkosten kanssa, jotka ovat hidastaneet sen käyttöönottoaikataulua. Ottamalla suoran yhteyden Valkoiseen taloon yhtiö viestii

Mastodon — https://defcon.social/@ai/116426982797972733 Mastodon — https://tldr.nettime.org/@remixtures/116425380613981753 www.nytimes.com — https://www.nytimes.com/2026/04/17/technology/white-house-anthropic-artificial-i www.pbs.org — https://www.pbs.org/newshour/politics/white-house-chief-of-staff-to-meet-with-an www.cnbc.com — https://www.cnbc.com/2026/04/17/anthropic-dario-amodei-trump-mythos.html nypost.com — https://nypost.com/2026/04/17/business/anthropic-ceo-dario-amodei-set-to-meet-wh thehill.com — https://thehill.com/policy/technology/5837086-anthropic-ai-white-house-meeting/ Mastodon — https://mastodon.social/@worldbrieflynews/116429471912393516

142

Mitä Mythos on ja miksi asiantuntijat ovat huolissaan Anthropicin AI-mallista

Mastodon +8 mastodon

anthropic

Anthropicin uusin suuri kielimalli, Claude Mythos, on peruutettu julkisesta käyttöönotosta sen jälkeen, kun sisäiset testit paljastivat ennennäkemättömän kyvyn paikantaa ja hyödyntää ohjelmistojen haavoittuvuuksia eri suurissa käyttöjärjestelmissä. Yritys ilmoitti, että malli pystyy tuottamaan toimivaa hyödyntämiskoodia, kartoittamaan käyttöoikeuksien laajentumispolkuja ja jopa laatimaan phishing‑viestejä minimaalisella ihmisen ohjauksella. Tunnin sisällä ilmoituksen jälkeen valtiovarainministerit, keskuspankit ja korkean tason pankkijohtajat kokoontuivat hätäkokouksiin ja varoittivat, että työkalu voisi antaa pahantahtoisille toimijoille “ihmisen ylittävän” edun kyberhyökkäyksissä kriittiseen rahoitusinfrastruktuuriin. Tämä paljastus on käynnistänyt aallon säätelypainetta. Tietoturvan päävastuuhenkilöt (CISO) ja kyberturvallisuusyritykset, joilla on mahdollisuus hyötyä lisääntyneestä puolustusratkaisujen kysynnästä, vaativat julkisesti nopeita toimia; analyytikot sanovat, että motivaatio heijastelee institutionaalista omansäilymistä yhtä paljon kuin aitoa riskinarviointia. Euroopan ja Yhdysvaltojen viranomaiset ovat jo laatineet hätämääräyksiä tekoälyasetuksen (AI Act) ja tekoälyyn perustuvien uhkien toimeenpanomääräyksen (Executive Order on AI‑enabled threats) puitteissa, ja useat kansallisen turvallisuuden virastot ovat asettaneet Anthropicin tarkkailulistalle. Miksi tämä on merkittävää, menee yksittäistä tuotetta pidemmälle. Mythos osoittaa, että generatiivinen tekoäly voi siirtyä kielitehtävistä itsenäiseen haavoittuvuuksien etsintään, poistaen perinteisesti puolustajia suojanneen tutkimuksen ja aseistamisen välistä aikaviivettä. Jos tällaiset kyvyt tulevat laajasti saataville, käyttöjärjestelmien, pankkialustojen ja hallituksen verkkojen suojauskustannukset voivat räjähtää, muuttaen kyberturvallisuusmarkkinoita ja pakottaen AI‑hallintokehysten uudelleenarviointiin. Mitä kannattaa seurata seuraavaksi: Euroopan komission tuleva AI‑riskiluokitus “kaksoiskäyttö”‑malleille, mahdolliset oikeudenkäynnit yrityksiltä, jotka väittävät altistuneensa, Anthropicin suunnitelma julkaista vahvistettu, “hiekkalaatikko‑”versio, sekä se, pyrkivätkö kilpailevat laboratoriot sisällyttämään vastaavia hyödyntämismoduuleja omiin tarjouksiinsa. Tulevat viikot paljastavat, käynnistääkö Mythos sääntelyuudistuksen vai onko se katalysaattori uudelle puolustavan AI:n asevarustelukilpailulle.

Mastodon — https://tldr.nettime.org/@remixtures/116422749764806834 www.scientificamerican.com — https://www.scientificamerican.com/article/what-is-mythos-and-why-are-experts-wo www.bbc.com — https://www.bbc.com/news/articles/c2ev24yx4rmo www.theguardian.com — https://www.theguardian.com/technology/2026/apr/10/anthropic-new-ai-model-claude www.bloomberg.com — https://www.bloomberg.com/news/features/2026-04-16/how-anthropic-discovered-myth www.wired.com — https://www.wired.com/story/anthropics-mythos-will-force-a-cybersecurity-reckoni Mastodon — https://igeek.gamer-geek-news.com/@feed/statuses/01KPF0MJ6FHC7X77MBNNZ0CPAH HN — https://www.ft.com/content/c9f5b690-a10e-4c66-9245-017f8bfbc7b4

124

Transformereiden ymmärtäminen Osa 9: Itsehuomio‑kerrosten kasaaminen

Dev.to +6 dev.to

Uusin osa “Transformereiden ymmärtäminen” -sarjasta, julkaistu tänään, suuntaa valokeilan itsehuomio‑kerrosten kasaamiskäytäntöön. Perustuen 17. huhtikuuta julkaistussa osassa 8 käsiteltyihin painojen jakamisen käsitteisiin, uusi artikkeli selittää, miten useita itsenäisesti parametrisoituja huomio‑lohkoja kerrostetaan, jotta malli voi siepata yhä abstraktimpia suhteita sekvenssin sisällä. Kirjoittaja käy läpi alkuperäisessä “Attention Is All You Need” -paperissa esitellyt kanoniset pelkän enkooderin ja pelkän dekooderin rakenteet, osoittaen, että jokainen kerros yhdistää monipäisen itsehuomio‑alijärjestelmän syötteen‑eteen‑verkkoon. Näiden parien kasaamalla transformerit voivat ylittää viimeaikaisten syväoppimisen opetusohjelmien korostaman yhden kerroksen rajoituksen, mahdollistaen eri päiden erikoistumisen syntaksiin, koreferenssiin tai pitkän kantaman diskurssimalleihin. Artikkeli kuvaa myös käytännön kompromisseja: syvemmät pinot lisäävät ilmaisukykyä, mutta kasvattavat muistinkulutusta ja koulutuksen epävakautta, mikä kannustaa tutkijoita kokeilemaan tekniikoita kuten kerrosnormin esikonditionointia ja gradienttien tarkistuspisteitä. Miksi tämä on merkittävää juuri nyt, on kaksijak

Dev.to — https://dev.to/rijultp/understanding-transformers-part-9-stacking-self-attention en.wikipedia.org — https://en.wikipedia.org/wiki/Transformer_(deep_learning) earezki.com — https://earezki.com/ai-news/2026-04-17-understanding-transformers-part-9-stackin www.ionio.ai — https://www.ionio.ai/blog/a-deep-dive-into-the-function-of-self-attention-layers papers.neurips.cc — https://papers.neurips.cc/paper/7181-attention-is-all-you-need.pdf introml.mit.edu — https://introml.mit.edu/notes/transformers.html

118

Ivan Fioravanti ᯅ (@ivanfioravanti) X:ssä

Mastodon +8 mastodon

agentsanthropic

Anthropicin uusin kielimalli, Opus 4.7, on herättänyt innostuksen aallon suunnittelijoiden keskuudessa sen jälkeen, kun teknologia‑neuvonantaja Ivan Fioravanti twiittasi mallin “rakkauden‑tason” vaikutuksesta sovellusten rakennusprosessiin. Fioravanti, joka johtaa AI‑keskeisiä projekteja CoreView‑yrityksessä, totesi, että uuden mallin suunnittelun‑generointikyvyt ovat niin kehittyneitä, että käyttäjät harkitsevat nykyisten suunnittelutyökalujen tilauksien perumista ilmaiseksi, AI‑ohjatun vaihtoehdon hyväksi. Opus 4.7 perustuu Anthropicin “Claude”‑sukupolveen, mutta siihen on lisätty multimodaalinen ydin, joka pystyy tulkitsemaan visuaalisia kehotteita, iteratiivisesti kehittämään käyttöliittymä‑mockupeja ja ehdottamaan asettelun tarkennuksia reaaliajassa. Varhaiset käyttäjät raportoivat, että malli pystyy tuottamaan korkean tarkkuuden wireframeja yhdestä lausekuvauksesta, mukauttamaan väripaletit automaattisesti brändiohjeistusten mukaisesti ja jopa generoimaan front‑end‑koodinpätkiä, jotka kääntyvät ilman manuaalista hienosäätöä. Näiden tuotosten nopeus ja tarkkuus merkitsevät selkeää harppausta aiemmasta Opus 4.0‑sarjasta, jossa vaadittiin laajaa jälkikäsittelyä. Kehitys on merkittävää, koska suunnittelu on pitkään ollut pullonkaula ohjelmistotoimituksissa. Rutiininomaisen UI‑luonnin siirtäminen LLM:lle mahdollistaa tuotetiimien lyhentää kehityssyklejä, vähentää riippuvuutta erikoistuneista suunnittelijoista ja alentaa kustannuksia. Laajemmalle AI‑markkinalle Anthropicin läpimurto kiristää kilpailua OpenAI:n GPT‑4.5:n ja Googlen Gemini‑1:n kanssa, työntäen alaa kohti yhä erikoistuneempia, toimialakohtaisia malleja sen sijaan, että keskityttäisiin pelkkiin tekstigeneraattoreihin. Seuraavaksi tarkkailtavaa on Anthropicin käyttöönottostrategia. Yritys on vihjannut kerrospohjaiseen hinnoitteluun, jonka avulla Opus 4.7 voisi olla startup‑yrityksille helposti saavutettavissa, kun taas yritysasiakkailta perittäisiin korkeampi maksimi‑API‑kapasiteetti. Integraatiokumppanuuksia suunnittelualustoihin, kuten Figma, Sketch ja Adobe XD, odotetaan tulevina kuukausina, ja benchmark‑tutkimuksia, joissa vertaillaan Opus 4.7:n suorituskykyä kilpailijoiden työkaluihin, on tarkoitus julkaista tämän neljänneksen loppupuolella. Kuten raportoimme 14 huhtikuuta, haaste ei enää ole pelkästään voimakkaiden LLM:ien rakentaminen, vaan myös käyttäjien ohjaaminen käyttämään niitä ilman “taikalausuntoja” – testi, jonka Opus 4.7 kohtaa pian todellisessa maailmassa.

Mastodon — https://mastodon.sayzard.org/@sayzard/116423021615493316 x.com — https://x.com/ivanfioravanti threadreaderapp.com — https://threadreaderapp.com/user/ivanfioravanti github.com — https://github.com/ivanfioravanti huggingface.co — https://huggingface.co/ivanfioravanti www.darkreading.com — https://www.darkreading.com/author/ivan-fioravanti Mastodon — https://mastodon.sayzard.org/@sayzard/116423021659157821 Mastodon — https://mastodon.sayzard.org/@sayzard/116423021572465079

108

Claude Design, Opus 4.7 -regressio, GPT‑5.3 ja KIMI K2 -vertailut

Dev.to +6 dev.to

anthropicbenchmarksclaudegpt-5

Anthropic lanseerasi tänään Claude Designin, selainpohjaisen ympäristön, jonka avulla käyttäjät voivat piirtää, prototypoida ja kehittää verkkosivujen asetteluja yhdellä kehotteella. Työkalu perustuu 18. huhtikuuta esittelemäämme design‑studio‑prototyyppiin, jolloin yhtiö avasi ensimmäisen “Design Studio” -toiminnon Claude‑mallille, ja siihen on lisätty visuaalinen kanvaasi, komponenttikirjasto sekä reaaliaikainen esikatselu, jotka kaikki hyödyntävät uusinta Claude Opus 4.7 -mallia. Julkaisu tapahtuu kehittäjien kasvavan valituskannan keskellä, jonka mukaan Opus 4.7 kärsii “vakavasta regressiosta” luotettavuudessa. Varhaiset käyttäjät raportoivat lisääntyneistä harhaanjohtavista CSS‑säännöistä ja ajoittaisista kaatumisista suuria token‑ikkunoita käsiteltäessä – selvä ristiriita mallin viime kuussa julkaistuihin vertailuarvoihin, jotka olivat 87,6 % SWE‑bench Verified -testissä ja etumatka GPT‑5.4:ään koodaustehokkuudessa. Anthropic ei ole vielä julkaissut virallista korjausta, mikä herättää huolta siitä, että mallin nopea ominaisuuksien lisäys saattaa ylittää sen vakauden. Samaan aikaan uudet poliittisen puolueellisuuden vertailut GPT‑5.3:lle ja avoimen lähdekoodin KIMI K2 -mallille valaisevat, miten suurten kielimallien käyttäytyminen muuttuu kiistanalaisissa kehotteissa. Itsenäinen pohjoismaisten yliopistojen konsortio toteutti testit, ja ne osoittivat, että GPT‑5.3 säilytti 92 % neutraalisuusasteen, kun KIMI K2 jäi 78 %:iin. Tämä viittaa siihen, että Claude‑malliin keskittyvä design‑painotteinen iterointi voisi muodostua kilpailueduksi, mikäli sen ydinmalli vakautuu. Mitä kannattaa seurata seuraavaksi: Odotetaan, että Anthropic julkaisee korjauspäivityksen Opus 4.7:lle kahden viikon sisällä, ja yhtiö on vihjannut “Claude Design Pro” -tasoon, joka integroi versionhallinnan ja tiimiyhteistyön. Samaan aikaan vertailukonsortio suunnittelee neljännesvuosittaista päivitystä, johon sisällytetään monikielisiä puolueellisuustestejä – mittari, joka voi vaikuttaa yritysten omaksumispäätöksiin Euroopassa. Sidosryhmien tulisi tarkkailla sekä Opus 4.7:n teknistä korjausta että kilpailevien mallien kehittyvää suorituskykyympäristöä, kun tekoälypohjainen design‑markkina kuumenee.

Dev.to — https://dev.to/soytuber/claude-design-opus-47-regression-gpt-53-kimi-k2-benchmar media.patentllm.org — https://media.patentllm.org/news/cloud-ai/claude-design-opus-4-7-regression-gpt- www.buildfastwithai.com — https://www.buildfastwithai.com/blogs/claude-opus-4-7-review-benchmarks-2026 artificialanalysis.ai — https://artificialanalysis.ai/articles/opus-4-7-everything-you-need-to-know www.vellum.ai — https://www.vellum.ai/blog/claude-opus-4-7-benchmarks-explained www.datacamp.com — https://www.datacamp.com/blog/opus-4-7

108

Anthropic esittelee Claude Designin, joka laatii näyttäviä uusia pink slip -mainoksia markkinointitiimeille

Mastodon +7 mastodon

anthropicclaude

Anthropic julkisti perjantaina Claude Designin, tutkimus‑esikatselupalvelun, jonka avulla käyttäjät voivat luoda markkinointitasoisia visuaalisia materiaaleja pelkän keskustelun avulla Claude‑mallin kanssa. Prototyyppi tuottaa kaikkea bannerimainoksista demo‑versiossa esiteltyihin “näyttäviin uusiin pink slip -mainoksiin”, asettaen keskustelevaa tekoälyä graafisen sisällön etupääksi, joka kiertää perinteiset suunnittelutyökalut. Julkaisu jatkaa Anthropicin viimeaikaista laajentumista generatiiviseen koodiin Claude Code -palvelun myötä, josta raportoimme aiemmin tällä viikolla. Laajentamalla Claude‑perhettä visuaaliseen mediaan yritys pyrkii madaltaamaan teknistä kynnystä hiottujen grafiikoiden tuottamiselle, mikä voi muuttaa merkittävästi markkinointitiimien tapaista luovan työn hankintaa. Claude Design toimii erillisellä käyttömittarilla ja viikoittaisilla rajoituksilla, mikä viestii Anthropicin aikomuksesta pitää sen erillisenä tuotealueena eikä pelkkänä lisäominaisuutena. Miksi se on merkittävää, on kaksijakoinen. Ensinnäkin palvelu astuu ruuhkattuun kenttään, jossa hallitsevat kuvapainotteiset mallit kuten Midjourney, DALL‑E ja Stable Diffusion, mutta erottautuu tekstipohjaisella käyttöliittymällä, joka lupaa nopeampaa iterointia ei‑suunnittelijoille. Toiseksi AI‑ohjatun visuaalisen tuotannon helppous herättää kysymyksiä ammatillisten suunnittelijoiden tulevaisuudesta ja luotujen aineistojen omistusoikeuksista, mikä resonoi Anthropicin Mythos‑malliin liittyvistä huolista ja sen mahdollisesta väärinkäytöstä. Seuraavaksi tarkkailtavaa on Anthropicin hinnoittelustrategia ja se, integroidaanko Claude Design olemassa oleviin luovuuspaketteihin tai pilvialustoihin kuten AWS. Alan tarkkailijat seuraavat myös mallin kykyä noudattaa brändiohjeita, tekijänoikeusvaatimuksia ja tuottaa suurta resoluutiota mittakaavassa. Täydellinen julkinen lanseeraus, käyttäjäpalautesilmukat ja mahdolliset kumppanuusilmoitukset mainosteknologiayritysten kanssa määrittelevät, onko Claude Design vain kapea kokeilu vai laajemman siirtymän katalysaattori kohti keskustelevaa visuaalista luomista.

Mastodon — https://indieweb.social/@jbz/116423000436274453 ai-navigate-news.com — https://ai-navigate-news.com/en/articles/4224f252-ec9a-441a-a2e6-78b2b7d8bd17 forums.theregister.com — https://forums.theregister.com/forum/all/2026/04/17/anthropic_debuts_claude_desi www.theregister.com — https://www.theregister.com/ www.freshnews.org — https://www.freshnews.org/home www.anthropic.com — https://www.anthropic.com/news Mastodon — https://defcon.social/@ai/116422968410091647

103

Kuinka Claude Code hallitsee 200 000 tokenia menettämättä mieltään

Dev.to +6 dev.to

agentsclaudegemini

Anthropic on julkaissut uuden kontekstin‑ikkuna‑arkkitehtuurin Claude Code:lle, joka venyttää mallin muistin noin 200 000 tokeniin säilyttäen koherenssin. Läpimurto perustuu lennossa toimivaan tiivistysmoottoriin, joka pakkaa aikaisemman dialogin tiiviiksi upotuksiksi, mahdollistaen mallin viittaamisen paljon suurempaan koodikantaan tai monituntiseen virheenkorjausistuntoon ilman “mielenmenetystä”, joka tavallisesti pakottaa kehittäjät käynnistämään agentit uudelleen muutaman minuutin jälkeen. Päivitys on merkittävä, koska se poistaa pitkään jatkunut pullonkaula AI‑ohjatuissa kehitystyökaluissa. Aiemmin jopa kaikkein kyvykkääimmät agentit — Claude Opus 4.7, joka tuli yleiskäyttöön viime viikolla — oli rajoitettu 128 k tokeniin, mikä pakotti käyttäjät manuaalisesti karsimaan tai jakamaan pitkät keskustelut. Automatisoimalla aikaisemman kontekstin tiivistämisen Claude Code pystyy seuraamaan laajoja projekteja, suuria refaktorointeja tai kokonaisia testisarjoja yhdessä istunnossa. Varhaiset sisäiset mittaukset osoittavat 30 %:n token‑viiveen vähenemisen ja havaittavan harhaluulojen vähenemisen, kun malli tarkastelee uudelleen aikaisempia koodinpätkiä. Tiimeille, jotka ovat jo ottaneet Claude Code:n käyttöön automatisoiduissa koodiarvioinneissa ja pariohjelmoinnissa, muutos lupaa sujuvampia työnkulkuja ja alhaisempaa operatiivista kuormitusta. Anthropicin käyttöönotto on aluksi rajoitettu maksullisiin suunnitelmiin, joissa koodin suoritus on käytössä, noudattaen huhtikuun 18 päivänä julkaistussa raportissamme esiteltyä Claude Code:n itse‑tiivistysominaisuutta koskevaa politiikkaa. Yritys kertoo järjestelmän hienosäädetään todellisen käytön dataa hyödyntäen, eikä hinnoittelua muuteta. Mitä kannattaa seurata seuraavaksi: tarkat suorituskykytiedot tulevasta “Long‑Context” -vertailusarjasta, tiivistyskerroksen mahdollinen laajentaminen Claude Opus‑ ja Claude Sonnet‑malleihin, sekä se, miten kilpailijat — OpenAI:n GPT‑4‑Turbo ja

Dev.to — https://dev.to/_2b847605e5fbe8a8c9e26/how-claude-code-manages-200k-tokens-withou www.xda-developers.com — https://www.xda-developers.com/claude-does-more-for-productivity-workflow-than-a www.devproblems.com — https://www.devproblems.com/claude-code-usage/ news.ycombinator.com — https://news.ycombinator.com/item?id=45595403 www.datastudios.org — https://www.datastudios.org/post/claude-opus-4-5-vs-claude-sonnet-4-5-full-repor mpgone.com — https://mpgone.com/claude-opus-4-5-vs-4-1/

102

Show HN: Sfsym – Vie Apple SF Symbolit vektorimuodossa SVG/PDF/PNG

HN +5 hn

applevector-db

Uusi avoimen lähdekoodin työkalu nimeltä **sfsym** mahdollistaa kehittäjien ja suunnittelijoiden viedä Applen SF Symbolit suoraan komentoriviltä SVG-, PDF- tai PNG-tiedostoina. Työkalu, jonka yapstudios on julkaissut GitHubissa MIT‑lisenssillä, liittää itsensä macOS‑vain SFSymbols.app‑sovellukseen ja tarjoaa yksinkertaisen syntaksin – esimerkiksi `sfsym get heart.fill > heart.svg` – jonka avulla voi hakea minkä tahansa yli 6 900 SF Symbols 7:ssä esitellyn symbolin, valinnaisten paino- ja skaalausparametrien kanssa. Julkaisu on merkittävä, koska SF Symbolit ovat muodostuneet de‑facto -ikoniaikakokoelmaksi iOS‑, macOS‑ ja watch

HN — https://github.com/yapstudios/sfsym developer.apple.com — https://developer.apple.com/sf-symbols/ stackoverflow.com — https://stackoverflow.com/questions/56449218/how-to-use-sf-symbols-in-ios-12-and reefwing.medium.com — https://reefwing.medium.com/creating-custom-sf-symbols-e295a2177aaf www.kodeco.com — https://www.kodeco.com/books/swiftui-cookbook/v1.0/chapters/4-add-an-icon-from-s

89

GitKrakenin käyttäjille, jotka käyttävät Claude Codea – GitKraken on (tai todennäköisesti tulee) muokannut

Mastodon +6 mastodon

claudecopilot

GitKrakenin työpöytäasiakasohjelma on hiljaisesti muuttanut Anthropicin Claude Code -konfiguraatiotiedostoa, lisäämällä sarjan komentorivikoukkuja, jotka ohjaavat jokaisen Claudeen syötetyn kehotteen GitKraken‑CLI:n kautta. Muutos, joka löydettiin %appdata%/.claude/settings.json‑tiedostosta, näyttää reitittävän käyttäjän syötteen määrittelemättömään kohteeseen ennen vastauksen palauttamista, asettaen näin näkymättömän välikäden AI‑avusteiseen koodausprosessiin. Muutoksen merkitys on suuri, koska Claude Codea markkinoidaan turvallisena, paikallisena avustajana koodin luomiseen ja refaktorointiin. Ohjaamalla pyynnöt GitKrakenin omien työkalujen kautta yritys saattaa kirjata, välimuistittaa tai jopa siirtää omistusoikeudellisia koodinpätkiä käyttäjän hallinnan ulkopuolisille palvelimille. Tämä herättää välittömiä vaatimustenmukaisuus‑ ja tietosuojaongelmia, erityisesti GDPR:n ja pohjoismaisten tietosuojalakien alaisissa säännellyissä toimialoissa tai missä tahansa tiimissä, jossa lähdekoodi katsotaan luottamukselliseksi. Se myös hämärtää rajan mukavuusominaisuuden ja mahdollisen tietojen vuotamisen välillä, mikä resonoi viimeaikaisen tarkastelun kanssa AI‑integraatioista kehitysympäristöissä. GitKraken ei ole vielä julkaissut julkista lausuntoa, mutta muutos vaikuttaa liittyvän laajempaan AI‑julkaisuun, jossa Claude, Copilot, Cursor ja muut avustajat on paketoitu yhdeksi “AI‑pinnaksi” käyttöliittymässä. Käyttäjiltä odotetaan nopeaa reagointia: korjauspäivitystä, joka poistaa koukut, selvennystä siitä, minne data lähetetään, ja mahdollisesti uusia opt‑out‑asetuksia. Myös Anthropic saattaa kommentoida tilanteen, jotta asiakkaat saavat varmistuksen siitä, että Claude‑koodin tietosuojagarantiat pysyvät voimassa kolmansien osapuolien työkalujen kautta. Seuraavaksi on syytä seurata GitKrakenin virallista viestintää, Claude‑Code‑lisäosan päivityksiä sekä sitä, omaksuvatko muut IDE:t tai Git‑GUI:t vastaavia piilotettuja reitityksiä. EU:n ja Skandinavian viranomaiset voivat myös tutkia käytäntöä, jos se katsotaan käyttäjän suostumuksen rikkomiseksi, mikä tekee tulevista viikoista kriittisiä sekä kehittäjille että mukana oleville toimittajille.

Mastodon — https://aus.social/@Pascal/116425585275979482 www.gitkraken.com — https://www.gitkraken.com/git-client www.youtube.com — https://www.youtube.com/watch?v=zd2Y5zumBWo ayushmorbar.medium.com — https://ayushmorbar.medium.com/mastering-the-developer-trio-vs-code-gitkraken-an stackoverflow.com — https://stackoverflow.com/questions/39272468/how-can-i-use-gitkraken-on-a-privat www.linkedin.com — https://www.linkedin.com/posts/blainebateman_datascience-activity-73615567618640

87

Claude Code Opus 4.7 jatkaa tarkkailua haittaohjelmien suhteen

HN +6 hn

anthropicclaude

Claude Code Opus 4.7, Anthropicin kehittäjille suunnatun LLM:n uusin versio, sisällyttää jokaisen koodinluontipyyntöön jatkuvan haittaohjelmien havaitsemissilmukan. Päivitys, jonka Anthropic ilmoitti lyhyessä blogikirjoituksessa maanantaina, laajentaa Opus 4.6:ssa otettua käyttöön turvallisuusmoduulia, joka käytti jo ihmisen kaltaista päättelyä haavoittuvuuksien havaitsemiseen. Opus 4.7 vie asian pidemmälle viittaamalla luotuihin koodinpätkiin ajantasaisessa uhkatiedon tietokannassa, merkitsemällä tunnetut haitalliset mallit, epäilyttävät API‑kutsut sekä koodin, joka vastaa kiristysohjelmien, kryptolouhijoiden tai toimitusketju‑hyökkäysten allekirjoituksia. Kun riski havaitaan, malli lisää automaattisesti varoituskommentin ja ehdottaa turvallisempia vaihtoehtoja, samalla kirjaamalla tapahtuman auditointijälkeen integroituja IDE‑ympäristöjä, kuten GitKrakenia, varten. Toimenpide on merkittävä, koska AI‑luotu koodi nousee nopeasti yritysten kehitysputkien kulmakiveksi, mutta ala on kamppaillut sen varmistamisessa, ettei samat mallit tahattomasti levitä haittaohjelmia. Sisällyttämällä reaaliaikaisen tarkistuksen suoraan luontiprosessiin Anthropic pyrkii sulkemaan kriittisen aukon, joka on tähän mennessä rajoittanut käyttöönottoa säännellyillä aloilla, kuten rahoituksessa ja terveydenhuollossa. Ominaisuus erottaa myös Claude Coden OpenAI:n Codex‑pohjaisista ratkaisuista, jotka edelleen luottavat jälkikäteen tehtäviin staattisen analyysin työkaluihin. Kuten raportoimme 18. huhtikuuta, Opus 4.6 esitteli jo miljoonan tokenin kontekstin ja monen agentin orkestroinnin; Opus 4.7:n turvallisuuskeskeisyys rakentuu tähän perustaan ja saattaa muodostua de‑facto‑standardiksi AI‑avusteisessa ohjelmistokehityksessä. Seuratkaa Anthropicin seuraavaa tiekarttajulkistusta, jonka odotetaan tapahtuvan tulevina viikkoina; siinä saattaa tulla esiin Opus 4.8, jossa on syvempi hiekkalaatikkoympäristö ja tiiviimpi integraatio CI/CD‑alustoihin. Varhaiset käyttäjät tarkkailevat myös benchmark‑päivityksiä SWE‑benchissä ja todellisia väärien positiivien määriä, kun kehittäjät tasapainottavat turvallisuusvalppauden ja koodauksen sujuvuuden välistä kompromissia.

HN — https://news.ycombinator.com/item?id=47814832 felloai.com — https://felloai.com/anthropic-launched-claude-opus-4-5-faster-cheaper-and-crazy- felloai.com — https://felloai.com/fr/anthropic-launched-claude-opus-4-5-faster-cheaper-and-cra felloai.com — https://felloai.com/fr/2025/11/anthropic-launched-claude-opus-4-5-faster-cheaper cybersecuritynews.com — https://cybersecuritynews.com/claude-opus-4-6-released/ www.theunwindai.com — https://www.theunwindai.com/p/claude-opus-4-6-and-gpt-5-3-codex-30-mins-apart

80

Anthropic lanseeraa Claude Opus 4.7 – vähemmän tehokas kuin Mythos

Mastodon +6 mastodon

agentsanthropicclaude

Anthropic esitteli Claude Opus 4.7:n 16. huhtikuuta, as

Mastodon — https://friendica.helvetet.eu/display/a7e70941-1d687fbd-3a0ca9a1ec512d94 computersweden.se — https://computersweden.se/article/4160194/anthropic-lanserar-claude-opus-4-7-min news.bitcoin.com — https://news.bitcoin.com/sv/anthropic-lanserar-claude-opus-4-7-agentbaserade-arb profitlyai.com — https://profitlyai.com/anthropic-lanserar-claude-opus-4-och-claude-sonnet-4/ www.nyteknik.se — https://www.nyteknik.se/tech/anthropic-lanserar-claude-haiku-45-intakterna-ska-m www.expressen.se — https://www.expressen.se/ekonomi/tech/ain-claude-opus-4-skulle-ersattas-tog-till

72

FOSDEM 2024 – Koti

Mastodon +7 mastodon

Vuotuinen vapaan‑ohjelmiston kokoontuminen FOSDEM palasi Brysseliin 3.–4. helmikuuta 2024, houkutellen tuhansia kehittäjiä Université Libre de Bruxellesin kampukselle tiiviin kaksipäiväisen ohjelman äärelle. 875 tapahtuman joukosta AI‑ ja koneoppimisen devroom erottui edukseen, tarjoten sarjan puheenvuoroja, joissa pureuduttiin suurten kielimallien (large‑language‑model) transformer‑arkkitehtuurin toimintaan sekä uusimpiin matalarankkaisiin alitilan hienosäätötekniikoihin. Akatemian ja teollisuuden edustajat johdattivat yleisön läpi käytännön toteutusten, vertailutulosten ja avoimen lähdekoodin työkaluketjujen, jotka madaltavat kynnystä monen miljardin parametrin mallien kokeiluun. Näiden istuntojen merkitys ulottuu konferenssisalin ulkopuolelle. Paljastamalla transformer‑arkkitehtuurin ja hienosäätöputket laajalle avoimen lähdekoodin yleisölle, FOSDEM nopeuttaa huipputason AI‑tutkimuksen leviämistä pohjoismaiseen ekosysteemiin, jossa startupit ja tutkimuslaboratoriot yhä enemmän turvautuvat yhteisölähtöisiin kehyksiin. Painotus toistettavassa, vähäresurssisessa hienosäädössä sopii alueellisiin prioriteetteihin, jotka korostavat kestävyyttä ja tietosuojaa, ja tarjoaa pienemmille tiimeille mahdollisuuden räätälöidä voimakkaita malleja ilman perinteisesti vaadittavia massiivisia laskentabudjetteja. Tulevaisuutta ajatellen FOSDEM‑tapahtuman luoma vauhti todennäköisesti johtaa useisiin konkreettisiin kehityksiin. Järjestäjät ilmoittivat, että puheenvuorot ja niihin liittyvät esitysmateriaalit arkistoidaan FOSDEM‑verkkosivustolle, tarjoten pysyvän resurssin kehittäjille, jotka eivät ehtineet paikalle. Useat esittelijät vihjasivat tulevista avoimen lähdekoodin kirjastoista, jotka integroivat käsitellyt matalarankkaiset adaptiomenetelmät suoraan suosittuihin kehyksiin kuten PyTorchiin ja TensorFlowhun. Lisäksi yhteisön reagointi on jo synnyttänyt kiinnostusta omistettuun pohjoismaiseen AI‑devroomiin FOSDEM 2025:lle, jossa alueelliset projektit voisivat esitellä kotimaisia ratkaisuja ja luoda rajat ylittäviä yhteistyömahdollisuuksia. Sidosryhmien tulisi pitää silmällä FOSDEM‑kutsua devroomeille myöhemmin tänä vuonna sekä helmikuussa pidettyihin puheenvuoroihin linkitettyjä GitHub‑varastoja, joista ensimmäinen aalto avoimen lähdekoodin kontribuutioita on jo odotettavissa.

Mastodon — https://mastodon.in.th/@anoncheg/116426535002105135 en.wikipedia.org — https://en.wikipedia.org/wiki/FOSDEM archive.fosdem.org — https://archive.fosdem.org/2024/ libre-soc.org — https://libre-soc.org/conferences/fosdem2024/ interoperable-europe.ec.europa.eu — https://interoperable-europe.ec.europa.eu/collection/open-source-observatory-oso www.collabora.com — https://www.collabora.com/news-and-blog/news-and-events/first-in-line-for-fosdem Mastodon — https://mastodontech.de/@anoncheg/116426534116483744

72

Ero Access Control Listin ja Capability Listin välillä – GeeksforGeeks

Mastodon +7 mastodon

gpu

GeeksforGeeks on julkaissut uuden oppaan, jossa puretaan klassinen turvallisuuskeskustelu käyttöoikeuslistojen (ACL) ja kyvykkyyslistojen välillä. Artikkeli, julkaistu 9. helmikuuta 2024, opastaa lukijoita objektikeskeiseen ACL‑malliin — jossa jokainen resurssi sisältää luettelon käyttäjistä ja sallituista toiminnoista — ja vertaa sitä subjekti‑keskeiseen kyvykkyyslistaan, joka pakkaa oikeudet muokattomiin tunnisteisiin, joita käyttäjä pitää hallussaan. Artikkeli huomauttaa myös, että suurten kielimallien (LLM) jalanjälkien nopea kasvu — kasvaen kaksi‑viisi kertaa nopeammin kuin yksittäisen GPU:n muisti pystyy käsittelemään — on herättänyt uudelleen kiinnostuksen kevyisiin, tunnistepohjaisiin käyttöoikeusjärjestelmiin AI‑työkuormille. Ajan merkitys on kaksijakoinen. Ensinnäkin AI‑ala kamppailee sen kanssa, miten tarjota hienojakoista, auditoitavaa pääsyä yhä suurempiin

Mastodon — https://mastodon.in.th/@anoncheg/116426535153018751 en.wikipedia.org — https://en.wikipedia.org/wiki/Access-control_list www.geeksforgeeks.org — https://www.geeksforgeeks.org/operating-systems/difference-between-access-contro prosuncsedu.wordpress.com — https://prosuncsedu.wordpress.com/2014/08/21/comparing-object-centric-access-con dev.to — https://dev.to/digitalpollution/understanding-and-configuring-oracle-access-cont www.listdiff.com — https://www.listdiff.com/ Mastodon — https://mastodontech.de/@anoncheg/116426534165750401

72

P4: FOSDEM 2024 offline [2024-02-09 pe] koulutettavat parametrit. Alirankkinen alitilan hienosäätö.

Mastodon +13 mastodon

embeddingsfine-tuning

Tutkimusryhmä esitteli uuden lähestymistavan massiivisten kielimallien hienosäätöön FOSDEM 2024 -tapahtumassa, osoittaen, että vain murto-osa mallin parametreista tarvitsee päivittää, jotta saavutetaan tehtäväkohtainen suorituskyky. Esitys, jonka nimi oli “P4: Offline Low‑Rank Subspace Fine‑tuning”, näytti, miten syötteen upotuskerros voidaan mukauttaa gradienttimenetelmällä, kun suurin osa verkosta pysyy jäädytettynä. Keskeiset temput ovat kaksiosaiset. Ensinnäkin Fastfood‑muunnos uudelleenkoodaa painopäivitykset, muuttaen tiheät gradientit kompaktiksi satunnaisprojektioiden joukkoksi, jotka ovat halpoja laskea ja tallentaa. Toiseksi menetelmä perustuu LoRA‑tekniikkaan (Low‑Rank Adaptation), jossa alirankkisia matriiseja – tai niiden Kronecker‑tulojen vastaavia – injektoidaan jokaiselle transformer‑kerrokselle. Jäädyttämällä esikoulutetut painot ja oppimalla vain nämä alirankkiset tekijät, koulutettavien parametrien määrä putoaa miljardien tasolta muutamaan tuhanteen, mikä leikkaa muisti‑ ja laskenta‑vaatimuksia dramaattisesti. Miksi tämä on merkittävää? Tekniikka tekee laitteessa tai reunalla tapahtuvan mallin mukauttamisen mahdolliseksi tinkimättä suurten esikoulutusten laadusta. Kuten raportoimme 15 huhtikuuta, Googlen Gemma 4 toimii jo täysin offline‑tilassa iPhone‑laitteilla, mutta tällaiseen rajoitettuun laitteistoon hienosäätö on tähän asti ollut saavuttamatonta. Uusi alirankkinen alitilan menetelmä voisi sulkea tämän kuilun, mahdollistaen personoidut AI‑avustajat, toimialakohtaiset chatbotit ja yksityisyyttä suojaavat sovellukset, jotka oppivat paikallisesti käyttäjädatan perusteella. Seuraavat askeleet, joihin kannattaa kiinnittää huomiota, sisältävät avoimen lähdekoodin toteutuksen julkaisun, todennäköisesti TensorFlow’n Parameter Server -ekosysteemin kautta, sekä integroinnin suosittuihin kirjastoihin kuten PyTorch‑Lightning. Teollisuuden toimijat saattavat pian sisällyttää menetelmän SDK:ihin mobiili‑ ja IoT‑laitteille, kun taas akateemiset ryhmät odottavat sen vertailua täyden mallin hienosäätöön standardeilla NLP‑testisarjoilla. Jos varhaiset tulokset pitävät paikkansa, alirankkinen offline‑sovitus voisi nousta seuraavan sukupolven reunalla tapahtuvan AI:n kulmakiveksi.

72

Claude Opus 4.7 ja tekoälyn runsauden loppu alkamassa

Dev.to +6 dev.to

claudegpt-5

Claude Opus 4.7 nousi otsikoihin tänään ei pelkästään teknisten hienosäätöjen vuoksi, vaan siksi, että sen yhteydessä julkaistiin ajatuskirjoitus, jossa varoitetaan “tekoälyn niukkuuden alkamisesta”. Kahden vuoden ajan yhä halvemmiksi ja yhä kykenevämmiksi kehittyneet mallit ovat nyt saaneet ensimmäisen merkin siitä, että markkinat ovat loppumassa edullisen laskentatehon ja lisensointivarannon, joka ruokkasi viimeaikaista kasvukautta. Opus 4.7 -päivitys, jonka Anthropic julkaisi tiistaina, tiukentaa omia sisäisiä turvallisuuskerroksiaan, lisää aggressiivisemman haittaohjelmien tunnistusrutiinin ja leikkaa mallin parametribudjettia infuusiokustannusten hillitsemiseksi. Samanaikaisessa artikkelissa analyytikot väittävät, että nousevat GPU-hinnat, tiukentuvat pilvipalveluntarjoajien kiintiöt ja patenttipohjainen lisensointiaalto kolmelta suurimmalta toimijalta – OpenAI, Google ja Anthropic – pakottavat kehittäjät valitsemaan suorituskyvyn ja kulujen välillä. Heidän mukaansa tuloksena on siirtyminen “runous”‑ajattelutavasta, jonka ansiosta tekoälytyökalut tuntuivat kulutettavilta, kohti uutta todellisuutta, jossa pääsy on sidottu budjettiin ja strategisiin kumppanuuksiin. Miksi tämä on merkittävää, on kaksijakoista. Ensinnäkin startupit, jotka rakensivat tuotteensa oletuksella, että API‑kutsut ovat rajattomia ja edullisia, kohtaavat mahdollisen kassavirran kiristymisen, mikä käynnistää kiireen optimoida tai siirtyä avoimen lähdekoodin vaihtoehtoihin. Toiseksi yritykset, jotka ovat luottaneet nopeaan prototyyppien kehittämiseen, saattavat joutua tarkastelemaan ROI‑laskelmiaan uudelleen, kun token‑hinta nousee ja mallilisensointi muuttuu rajoittavammaksi. Kuten raportoimme 18. huhtikuuta, “Claude Code Opus 4.7 tarkistaa jatkuvasti haittaohjelmia”, mikä korostaa mallin kasvavia sisäisiä suojatoimia. Seuraavien viikkojen aikana selviää, muuntaako Anthropicin kustannusten leikkaaminen korkeampiin hintoihin loppukäyttäjille vai avaako yhtiö kerrospohjaisen pääsyohjelman säilyttääkseen “runsauden” kehittäjäkokemuksen. Seuratkaa ilmoituksia hinnoittelutasojen, pilvipalvelukumppanuuksien ja mahdollisten avoimen lähdekoodin haarojen osalta, jotka pyrkivät pitämään tekoälymarkkinat kilpailukykyisinä uhkaavan niukkuuden keskellä.

Dev.to — https://dev.to/jtorchia/claude-opus-47-y-el-principio-del-fin-de-la-abundancia-e es.wikipedia.org — https://es.wikipedia.org/wiki/Claude_Debussy www.xataka.com — https://www.xataka.com/robotica-e-ia/gran-revolucion-gpt-5-3-codex-claude-opus-4 www.xataka.com — https://www.xataka.com/robotica-e-ia/siete-ias-han-jugado-36-horas-seguidas-a-di tecnemia.com — https://tecnemia.com/a/8406/Informe-alerta-sobre-riesgos-de-seguridad-en-Claude- www.menendezymenendez.com — http://www.menendezymenendez.com/2024/02/gonzalo-guerrero-y-geronimo-de-aguilar.

71

Jos et jo tiedä vastauksena kysymykseen, satunnainen vastaus, joka tulee ulos

Mastodon +6 mastodon

Tutkimusryhmä Kööpenhaminan yliopistosta esitteli prototyypin, jota kutsutaan “slop‑koneeksi”, verkkopohjaiseksi työkaluksi, joka tuottaa vastauksia mihin tahansa käyttäjän esittämään kysymykseen hyödyntäen massiivista, kuratoimatonta kielimallien tietokantaa. Live‑demoissa järjestelmä loi uskottavan kuuloisia vastauksia kysymyksiin kuten “Mikä aiheuttaa revontulet?” ja “Miten kvanttitulva toimii”, mutta kun käyttäjillä ei ollut ennakkotietoa, tuotettua sisältöä oli mahdotonta tarkistaa. Kehittäjät varoittivat itsekin, että vastausten satunnaisuus tekee työkalusta hyödytöntä kenellekään, joka ei pysty itse arvioimaan totuudenmukaisuutta, muuttaen sen digitaaliseksi oraakliksi, joka ainoastaan pursuaa itsevarmaa hölynpölyä. Demonstratio korostaa kasvavaa ongelmaa tekoälyalalla: suuret kielimallit voivat keksittää yksityiskohtia, jotka kuulostavat auktoriteetilta, ilmiö, jota usein kutsutaan “hallusinaatioksi”. Satunnaiskäyttäjille tai yrityksille, jotka luottavat tekoälyyn päätöksenteossa, kyvyttömyys erottaa fakta keksinnöstä heikentää luottamusta ja nostaa esiin väärän tiedon leviämisen uhkan. Kuten raportoimme 18. huhtikuuta, Anthropicin Mythos‑malli herätti samankaltaisia huolia perusteettomista vastauksista, mikä osoittaa, että ongelma ei rajoitu yhteen toimittajaan. Mitä seuraavaksi tapahtuu, tulee todennäköisesti muovaamaan sitä, miten ala käsittelee todentamiskuilua. Tutkijat kilpailevat itse‑tarkistavien mekanismien, kuten hakupohjaisen generoinnin ja luottamus‑pisteytyskerrosten, sisällyttämisestä seuraavan sukupolven malleihin. Anthropic on vihjannut tulevasta Mythos‑päivityksestä, joka painottaa faktapohjaista perustelua, kun taas avoimen lähdekoodin projektit kuten Claude Code ovat osoittaneet token‑tehokkaita arkkitehtuureja, jotka voisivat tukea laajempaa lähdeviittausta ilman nopeuden heikkenemistä. EU:n sääntelijät laativat myös ohjeistuksia, jotka voisivat vaatia tekoälyjärjestelmiä ilmoittamaan epävarmuustasot vastauksia esittäessään. Sidosryhmien tulisi seurata näiden itse‑todentamistoimintojen käyttöönottoa, mahdollisten uusien EU:n tekoälyn läpinäkyvyyssääntöjen vaikutuksia sekä sitä, kehittyvätkö slop‑koneen kaltaiset työkalut pelkästä uteliaisuudesta vastuullisesti kalibroituun avustajaan. Keskeinen kysymys pysyy: voivatko tekoälyt koskaan luotettavasti vastata siihen, mitä emme vielä tiedä, vai jääkö se ikuisesti korkean teknologian ennustuksenkiven versioksi?

Mastodon — https://mstdn.plus/@gcvsa/116423414095848251 learnhip.com — https://learnhip.com/randomq/ faculty.washington.edu — https://faculty.washington.edu/ejslager/random-generator/index.html randomwordgenerator.com — https://randomwordgenerator.com/question.php www.ultimatesolver.com — https://www.ultimatesolver.com/en/random-yes-no teambuilding.com — https://teambuilding.com/en/articles/random-questions

66

Anthropic rajoitti Opus 4.6:n ennen Opus 4.7:n julkaisua

HN +6 hn

anthropicclaude

Anthropic hiljaisesti rajoitti Opus 4.6 -malliaan viikkoja ennen 16. huhtikuuta tapahtunutta Opus 4.7 -julkaisua, leikkaamalla läpimenoa ja supistamalla joitakin vastausten generointiparametreja. Entisen insinöörin jakama sisäinen telemetria osoittaa, että yhtiö vähensi maksimimäärää token‑sekunnissa noin 40 % ja otti käyttöön tiukemmat turvallisuussuodattimet, jotka hillitsivät mallin luovuutta. Sisäisten lähteiden kuvaama toimenpide, jota kutsutaan “adaptatiiviseksi rajoittamiseksi”, oli tarkoitettu estämään vanhentuneen infrastruktuurin ylikuormittuminen samalla kun uusi, tehokkaampi Opus 4.7 otettiin käyttöön. Alennus on merkittävä, koska Opus 4.6 on toiminut työvoimana lukuisille yrityssovelluksille ja kehittäjätyökaluille, jotka on lanseerattu helmikuusta lähtien. Tiimit, jotka rakensivat putkistoja mallin alkuperäisen nopeuden ja tuotantolaadun ympärille, kohtaavat nyt suurempaa viivettä ja pienempiä token‑budjetteja, mikä pakottaa nopeaan siirtymiseen uudemman mallin pariin tai kalliin uudelleensuunnittelun. Muutos ruokkikin kritiikkiä siitä, että Anthropic käyttäisi suorituskyvyn rajoittamista keinona pakottaa päivityksiä, mikä heijastuu X‑ ja Reddit‑valituksiin, joissa Opus 4.7 koetaan “taisteliakkaaksi” ja virheherkemmäksi huolimatta sen mainitusta kaksinkertaisesta tarkistustoiminnosta. Samanaikaisesti uusi malli lupaa korkean resoluution näkökyvyn, “xhigh” –tasoiset ponnistukset sekä token‑kustannusetua – väitteitä, joita ovat ylistäneet sijoittajat kuten Y Combinatorin Garry Tan. Kuten raportoimme 18. huhtikuuta, Opus 4.7 on tähän mennessä kaikkein kykenevin Claude‑malli, mutta varhaiset käyttäjäpalautteet ovat ristiriitaisia. Seuraavien viikkojen aikana selviää, kaventuuko suorituskykyero, kun Anthropic hienosäätää uutta moottoria, vai tuleeko vanhojen mallien lisärajoituksista toistuva ilmiö. Seuratkaa Anthropicin virallista vastausta, hinnoittelutasojen päivityksiä sekä mahdollisia sääntelykysymyksiä mallien läpinäkyvyydestä, erityisesti kun yhtiö valmistautuu esittelemään seuraavan sukupolven Mythos‑järjestelmänsä.

HN — https://fagnerbrack.com/how-anthropic-nerfed-opus-4-6-before-the-4-7-launch-c932 www.businessinsider.com — https://www.businessinsider.com/anthropic-claude-opus-4-7-backlash-tokens-2026-4 medium.com — https://medium.com/neuralnotions/anthropic-just-dropped-claude-opus-4-7-heres-ev www.axios.com — https://www.axios.com/2026/04/16/anthropic-claude-opus-model-mythos www.roborhythms.com — https://www.roborhythms.com/claude-opus-4-7-regression-backlash/ quasa.io — https://quasa.io/media/anthropic-keeps-delivering-claude-opus-4-7-is-here-and-it

63

Meta – seuraavan sukupolven tekoäly “Avocado” saattaa viivästyä, koska se ei pysy kilpailijoiden tahdissa – CNET Japan

Mastodon +8 mastodon

agentsbenchmarksllamameta

Meta on siirtänyt seuraavan sukupolven perustavanlaatuisen mallinsa, koodinimeltään “Avocado”, lanseerausta. Alkuperäisenä tavoitteena ollut maaliskuun 2026 aikaraja on nyt siirretty vähintään toukokuuhun 2026. Sisäiset vertailutestit paljastivat, että Avocado jäi jälkeen Googlen, OpenAI:n ja Anthropicin kilpailevien järjestelmien suorituskyvystä, minkä vuoksi yhtiö on päättänyt viivästyttää julkaisua ja antaa insinööreille aikaa kaventaa tätä eroa. Viiveellä on merkittäviä seurauksia, sillä Avocado oli tarkoitus olla Metan lippulaivatekoäly, jonka odotettiin tekevän mahdolliseksi kaikenlaiset sovellukset uudistetusta Llama‑3‑sarjasta uusiin agenttipohjaisiin tekoälypalveluihin sen sosiaalialustoilla. Jos malli jää kilpailijoiden jälkeen, se heikentää Metan neuvotteluasemaa nopeasti yhtenäistymässä olevaan tekoälyekosysteemiin, jossa Googlen Gemini 3.1 Flash TTS ja Anthropicin Claude 4.7 ovat jo osoittaneet vahvat multimodaaliset kyvyt ja tiiviin integraation kehittäjätyökaluihin. Metan viive heijastaa myös laajempaa alan suuntausta: yritykset ovat haluttomia julkaista malleja, jotka eivät täytä “kolmen suuren” asettamaa korkeaa kynnystä, sillä se voisi heikentää kehittäjien luottamusta ja markkinaosuutta. Tulevaisuudessa Meta tutkii mahdollisesti väliaikaista lisenssisopimusta Googlen kanssa, jonka avulla Gemini‑pohjaista inferenssiä voitaisiin käyttää sen tuotteissa, kun Avocadoa hioa. Tarkkailijat odottavat Metan julkaiseman julkisen suorituskykytiedon, erityisesti vertailuarvoja standardeilla mittareilla kuten MMLU, BIG‑bench ja multimodaaliset päättelytestit. Uudistetun lanseerausajankohdan, mahdollisen lisenssisopimuksen laajuuden sekä sen, miten Meta asemoituu Avocadoa vastaan tuleviin OpenAI:n GPT‑4.5‑ ja Anthropicin Claude 5 –julkaisuihin nähden, määrittelevät kilpailudynamiikkaa loppuvuodelle. Jos Meta onnistuu kaventamaan suorituskykyaukon, Avocado voi edelleen nousta keskeiseksi osaksi sen tekoälystrategiaa; jos ei, yhtiön on ehkä harkittava tiekarttansa kokonaisvaltaista uudelleenarviointia.

Mastodon — https://jforo.com/@yayafa/116425568148260785 aihaven.com — https://aihaven.com/news/meta-avocado-ai-model-delayed-may-2026/ www.nytimes.com — https://www.nytimes.com/2026/03/12/technology/meta-avocado-ai-model-delayed.html www.cnet.com — https://www.cnet.com/tech/services-and-software/meta-ai-model-delay-avocado-news www.msn.com — https://www.msn.com/en-us/news/other/meta-delays-avocado-ai-after-test-setback/g creati.ai — https://creati.ai/ai-news/2026-03-14/meta-delays-avocado-ai-model-launch-may-202 Mastodon — https://jforo.com/@yayafa/116425531549382420 Mastodon — https://jforo.com/@yayafa/116420984891123540

60

270 sekunnin sääntö: Kuinka leikata Claude Code‑API:n kustannuksia 90 % älykkäästi

Dev.to +5 dev.to

agentsanthropicclaude

Anthropicin Claude Code‑malli on pitkään ollut kehittäjien suosikki monen‑agenttisen työnkulun rakentamisessa, mutta toistuvien API‑kutsujen hinta on pitänyt monia projekteja tiukassa budjetissa. Yhteisön kehittämä “270‑sekunnin sääntö” lupaa nyt pudottaa nämä kulut jopa 90 %:lla hyödyntämällä mallin sisäänrakennettua prompt‑välimuistia. Välimuisti tallentaa viimeisimmän promptin viideksi minuutiksi (300 sekuntia). Kun orkestrointisilmukka käynnistyy uudelleen ennen välimuistin vanhenemista, Anthropic veloittaa vain noin 10 % täyden syöte‑token‑hinnasta, koska välimuistissa oleva konteksti käytetään uudelleen. Jos silmukka kestää noin 270 sekuntia tai pidempään, välimuistimerkintä katsotaan vanhentuneeksi ja seuraava pyyntö maksaa täyden hinnan. Ajoittamalla kutsut pysymään tässä aikavälissä – tai yhdistämällä useita operaatioita yhdeksi pyynnöksi – kehittäjät voivat pitää suurimman osan token‑maksuista murto-osana tavallisesta hinnasta. Miksi tämä on merkittävää, ei ole pelkkä laskun säästämisen temppu. Claude Code mahdollistaa koodin generoinnin, turvallisuusskannauksen ja automaattisen refaktoroinnin työkaluissa kuten GitKrakenin uusissa AI‑laajennuksissa, joista raportoimme 18 huhtikuuta. Korkean taajuuden orkestrointisilmukat ovat keskeinen malli näissä tuotteissa, ja kustannuseste on rajoittanut niiden skaalautuvuutta startup-yrityksissä ja tutkimuslaboratorioissa Pohjoismaissa. 90 %:n kustannusleikkaus muuttaa AI‑avusteisen kehityksen talousmallia, tehden jatkuvasta, hienojakoisesta avusta toteutettavissa pienemmille tiimeille ja julkisen sektorin hankkeille. Seuraavaksi tarkkailtavaa on Anthropicin reagointi. Yritys saattaa julkaista välimuistin hallintalippuja, säätää TTL‑aikaa tai ottaa käyttöön porrastetun hinnoittelun, joka formalisoisi säästöt. Samaan aikaan SDK‑päivitykset odottavat tuovansa mukanaan apufunktioita automaattiseen silmukan säätelyyn, ja kolmannen osapuolen työkalut – erityisesti CI/CD‑putkissa – todennäköisesti sisällyttävät säännön oletusoptimointiin. Pidä silmällä Anthropicin kehittäjäblogia ja tulevia Claude Code‑julkaisuja, joista voi löytyä konkreettisia muutoksia, jotka vakiinnuttavat 270‑sekunnin säännön standardiksi kustannustenhallintakäytännöksi.

Dev.to — https://dev.to/gentic_news/the-270-second-rule-how-to-cut-claude-code-api-costs- code.claude.com — https://code.claude.com/docs/en/costs hashnode.com — https://hashnode.com/posts/the-270-second-rule-how-to-cut-claude-code-api-costs- amitkoth.com — https://amitkoth.com/reduce-claude-api-costs/ www.geeky-gadgets.com — https://www.geeky-gadgets.com/claude-code-cost-saving-techniques/

59

Ihmisen tietoisuus kyberneettisessa aikakaudessa

Mastodon +6 mastodon

Apple ja Google rikkovat omia sääntöjään mainostamalla “Nudify”-sovelluksia, raportti väittää

Mastodon +6 mastodon

applegoogle

Applea ja Googlea syytetään väitteittäin omien sisältösääntöjensä rikkomisesta, kun ne esittelevät AI‑pohjaisia “nudify”-sovelluksia App Store -kaupassa ja Google Play -kaupassa. Tech Transparency Projectin (TTP) tekemä uusi tutkimus löysi yli tuhan sovelluksen, jotka väittävät poistavansa vaatteita valokuvista tai vaihtavansa kasvot, ja havaitsi, että molempien alustojen hakuehdotukset ja mainospaikat mainostavat näitä sovelluksia käyttäjille säännöllisesti. Löytö on ristiriidassa yritysten julkaiseman politiikan kanssa, jonka mukaan sovellukset, jotka luovat seksualisoituja kuvia todellisista ihmisistä ilman suostumusta, ovat kiellettyjä. Applen App Store Review Guidelines -ohjeet ja Googlen Developer Program Policy -kehittäjäohjelman säännöt kieltävät nimenomaan ei‑suostumukselliset deepfake‑sisällöt ja alastomuutta koskevat materiaalit, mutta raportti osoittaa, että sovellukset ovat edelleen listattuna ja jopa korostettu hakusanojen automaattisessa täydennyksessä sekä sponsoroidu

Mastodon — https://mastodon.crazynewworld.net/@hans/116424161225298242 news.google.com — https://news.google.com/stories/CAAqNggKIjBDQklTSGpvSmMzUnZjbmt0TXpZd1NoRUtEd2pr www.androidauthority.com — https://www.androidauthority.com/google-apple-ai-nudify-apps-3635836/ www.digit.in — https://www.digit.in/features/general/apple-and-google-reportedly-hosting-deepfa unn.ua — https://unn.ua/en/news/apple-and-google-allow-nudity-apps-despite-bans-bloomberg www.wired.com — https://www.wired.com/story/undress-app-ai-harm-google-apple-login/

56

Frontiers +6 2026-04-15 news

Uusi tutkimusaihe, joka kattaa musiikin signaalinkäsittelyn, koneoppimisen ja laajat kielimallit, on avattu tutkijoille, mikä merkitsee siirtymistä puhtaasti algoritmisten läpimurtojen kehittämisestä työkaluihin, jotka palvelevat muusikoita, opettajia ja muita ei-tekniikkaan liittyviä käyttäjiä. Tutkimusaiheen avausilmoitus, jonka julkaisi lehden toimitusneuvosto, korostaa, että vaikka viimeaikaiset tutkimukset ovat edistäneet ääni-kielimallien rajoja, kuten Music Flamingo -järjestelmä, joka pystyy tulkkaamaan ja generoimaan monimutkaisia musiikillisia rakenteita, suurin osa näistä edistysaskelista on edelleen laboratorioissa. Toimitusneuvosto väittää, että kehitys jää paikalleen, koska kehittäjät harvoin ottavat huomioon viiveen, tulkinmoisuuden ja työnkulun rajoitukset, joita ei-tekniikkaan liittyvät käyttäjät kohtaavat, kun he integroivat tekoälyä harjoituksiin, live-ääneen tai luokkaympäristöihin. Tämä asia on tärkeä nyt kahdesta syystä. Ensinnäkin tekoälykäyttöinen äänimarkkinat laajenevat nopeasti; arvioiden mukaan tekoälyllä parannetut musiikintuotantotyökalut valtaavat merkittävän osan maailmanlaajuisesta DAW-markkinasta seuraavan kolmen vuoden aikana. Toiseksi laajat kielimallit (LLM) yhdistyvät signaalinkäsittelyputkistoihin, mikä lupailee "semanttista" ohjausta sävylle, sovitukselle ja efekteille, mutta vain, jos nämä ohjaimet voidaan ilmaista selkeällä kielellä tai intuitiivisilla eleillä. Tämän kuilun ylittäminen voisi demokratisoida korkealaatuisen musiikin luomisen, alentaa esteitä itsenäisille artisteille ja avata uusia keinoja saavutettavuusteknologioille, kuten kuulovammaisten apuvälineille. Se, mitä kannattaa seurata seuraavaksi, ovat ensimmäiset tutkimusartikkelit, jotka ilmestyvät tästä aiheesta. Odotetaan tapaustutkimuksia, jotka arvioivat LLM-ohjattuja käyttöliittymiä live-muusikoiden kanssa, vertailuja, jotka mitoittavat reaaliaikaisen viiveen kuluttajaluokan laitteilla, ja ehdotuksia yhteensopivista tekoälylisäosista. Jos tutkijayhteisö toimittaa toimivia prototyyppejä, suuret DAW-valmistajat ja striimauspalvelut voivat alkaa integroida LLM-tukea tuotteisiinsa, muuttaen nykyisen tutkimushuuman jokapäiväisiksi luoviksi työkaluiksi. Tämä aloite perustuu viimeaikaisen tekoälyääni-tutkimuksen vauhtiin - erityisesti Music Flamingo -malliin ja laajemmin tekoälyllä parannettuun laskennalliseen kuulemiseen - ja kutsuu nimenomaisesti tutkimuksia, jotka vastaavat "kenelle" ja "miten". Sidosryhmien tulisi seurata tulevia konferenssisessioita ja teollisuuden esittelyjä, jotka esittelevät näitä käyttäjäkeskeisiä prototyyppejä, koska ne osoittavat, miten nopeasti kuilu edistyksellisten mallien ja jokapäiväisen musiikin harjoituksen välillä on sulkeutumassa.

Frontiers — https://www.frontiersin.org/research-topics/80293/ubiquitous-musical-signal-proc arxiv.org — https://arxiv.org/abs/2511.10289 www.merl.com — https://www.merl.com/publications/docs/TR2025-116.pdf link.springer.com — https://link.springer.com/content/pdf/10.1186/s13636-024-00353-7.pdf www.emergentmind.com — https://www.emergentmind.com/papers/2409.01864 Mastodon — https://mastodon.social/@theinternetiscrack/116426028439308935

36

3 tuntia Claude Opus 4.7:n kanssa: toimiva tutkimus‑webapp ja etä‑MCP – yhdellä kertaa

HN +6 hn

anthropicclaudecohere

Claude Opus 4.7 todisti pitkän aikavälin autonomiansa kolmen tunnin live‑testissä, jossa syntyi täysin toimiva tutkimus‑webapp ja etä‑mallinhallintapaneeli (MCP) ilman ihmisen kirjoittamaa koodia. Kehittäjä, joka työskenteli yhdestä kehotteesta, pyysi Claudea suunnittelemaan käyttöliittymän, luomaan Flask‑taustajärjestelmän, kytkemään PostgreSQL‑tietokannan ja julkaisemaan API:n, jota voitaisiin kutsua erillisestä selaimessa toimivasta ohjauspaneelista. Muutamassa minuutissa malli toimitti täydellisen projektirungon, ja lyhyen tarkennus‑kysymysten syklin jälkeen se hienosäätää autentikoinnin, lisäsi sivutuksen ja asensi koko pinon ilmaiseen Heroku‑instanssiin. Istunnon lopussa webapp oli käynnissä, tietoja voitiin syöttää, ja etä‑MCP mahdollisti käyttäjän säätää mallin parametreja ja tarkastella token‑käyttöä reaaliaikaisesti. Miksi tämä on merkittävää, on kaksijakoista. Ensinnäkin testi vahvistaa Anthropicin omissa käyttöönotto‑muistiinpanoissa esitetyt väitteet siitä, että Opus 4.7 pystyy ylläpitämään “vaativia ongelmia” tunteja, mikä on merkittävä harppaus aiempiin malleihin verrattuna, jotka usein pysähtyivät muutaman sadan tokenin jälkeen. Toiseksi kyky tuottaa kokonaisvaltaista tuotantokoodia katkaisee iterointisilmukan, joka on rajoittanut AI‑avusteista kehitystä pätkä- ja prototyyppiratkaisuihin. Startupeille ja suuryrityksille, jotka jo kamppailevat osaajapulan kanssa, malli, joka pystyy itsenäisesti toimittamaan käyttökelpoisia palveluita, voi muuttaa insinööribudjetteja ja nopeuttaa markkinoille pääsyä. Mitä kannattaa seurata seuraavaksi, on Anthropicin tuleva Opus 4.7:n integrointi Vertex AI:hin ja AWS Bedrockiin, mikä tekee mallista skaalautuvasti saatavilla olevan ja mahdollisesti laskee 5–25 USD:n per miljoona tokenia olevaa hintakynnystä. Yhteisö testaa myös parhaita käytäntöjä noudattavia mallipohjia, jotka yhdistävät yksityiskohtaiset suunnitelmat “korkean vaivan” kehotteisiin – tekniikka, jonka korostimme aiemmassa analyysissämme Opus 4.7:n suorituksesta 18. huhtikuuta. Jatkotestit Sonnet 4.8:n ja Mythos 5:n kanssa paljastavat, kääntyykö Opus‑autonomia tasaiseksi laaduksi eri toimialoilla, ja omaksuvatko kehittäjät sen ensisijaiseksi koodauskumppaniksi vai pitävätkö sen erikoistuneena avustajana.

HN — https://github.com/AmmarSaleh50/study-dashboard-demo www.youtube.com — https://www.youtube.com/watch?v=OIfRt1oyAss www.anthropic.com — https://www.anthropic.com/news/claude-opus-4-7 claude.com — https://claude.com/resources/tutorials/working-with-claude-opus-4-7 apidog.com — https://apidog.com/blog/claude-opus-4-7-free/ claudefa.st — https://claudefa.st/blog/guide/development/opus-4-7-best-practices

36

Mastodon +6 mastodon

agentschipscopilotmicrosoft

Microsoft on nostanut Surface‑laitteidensa hintalappuja, lisäten 100–500 dollaria useimpiin malleihin, kun ala kamppailee uudelleen syvenevän RAM‑pulan kanssa. Hinnan korotus, jonka Microsoftin omat kauppalistaukset vahvistavat ja Windows Central raportoi, heijastaa DRAM‑ ja NAND‑piirien hintojen nousua, jotka ovat kiristyneet pandemian aikaisista kysyntäpiikeistä, toimitusketjun pullonkauloista ja tekoäly‑ohjautuvien datakeskusten kasvusta. Siirtämällä korkeammat komponenttikustannukset kuluttajille Microsoft viestii, että pula ei ole enää tilapäinen häiriö, vaan rakenteellinen rajoite, joka vaikuttaa premium‑tietokoneisiin. Liike vaikuttaa laajemmin kuin pelkkään kannettava‑tietokone‑markkinaan, ja se nostaa kolmea suurinta muistikomponenttien valmistajaa—SK Hynix, Micron ja SanDisk (Western Digitalin NAND‑haara)—sijoittajien tarkastelukohdaksi. SK Hynix, maailman toiseksi suurin DRAM‑toimittaja, hyötyy aggressiivisesta kapasiteetin laajennusohjelmastaan Etelä-Koreassa, jonka tavoitteena on lisätä yli 300 GB sekunnissa uutta tuotantoa vuoteen 2027 mennessä. Micron, ainoa Yhdysvaltojen DRAM‑valmistaja, on kiihdyttänyt 3‑D‑pinottujen teknologioiden käyttöönottoa, mutta sen tulos on edelleen epävakaa kuluttajien PC‑kysynnän ja yritysten AI‑kuormien vaihtelun vuoksi. SanDisk, vaikka se on pääasiassa NAND‑pelaaja, nauttii monipuolisesta portfoliosta, johon sisältyvät kiintolevyt datakeskusten palvelimille – segmentti, joka laajenee, kun generatiiviset AI‑mallit kuluttavat yhä enemmän tallennustilaa. Sijoittajien tulisi seurata neljännesvuosikatsauksia saadakseen vihjeitä siitä, miten kukin yritys tasapainottelee varastotilanteen ja edelleen ylivarastoituneen piirimarkkinan välillä, sekä tarkkailla ilmoituksia uusista tehdaskapasiteeteista tai yhteisyrityksistä, jotka voivat kallistaa kilpailuasetelman. Lisähintojen säätö Microsoftilta tai siirtyminen vaihtoehtoiseen piiriin, kuten LPDDR5X, testaisi kysynnän joustavuutta ja voisi muokata kolmen valmistajan liikevaihtonäkymiä. Seuraava tuloskausi, joka on suunniteltu alkamaan Q3:n alussa, todennäköisesti paljastaa, mikä piirivalmistaja on parhaiten asemoitunut hyötymään käynnissä olevasta muistikriisistä.

Mastodon — https://jforo.com/@yayafa/116424012978020604 www.pcmag.com — https://www.pcmag.com/news/microsoft-raises-prices-of-surface-laptops-amid-memor www.tradingkey.com — https://www.tradingkey.com/analysis/stocks/us-stocks/261779769-microsoft-surface www.msn.com — https://www.msn.com/en-us/news/technology/the-memory-shortage-strikes-again-this finance.yahoo.com — https://finance.yahoo.com/sectors/technology/articles/microsoft-raises-surface-p www.windowscentral.com — https://www.windowscentral.com/hardware/surface/microsoft-reveals-major-price-in

32

fly51fly (@fly51fly) X:ssä

Mastodon +6 mastodon

Kiinalainen tekoälytutkija ja BUPT:n professori fly51fly ilmoitti uudesta lähestymistavasta, jolla laajennetaan suurten kielimallien (LLM) kykyä käsitellä erittäin pitkiä syötteitä. X‑julkaisussaan hän esitteli “Shuffle the Context” –menetelmän, joka on itse‑distillointitekniikka ja muokkaa suositun Rotary Positional Embedding (RoPE) -menetelmän toimintaa siten, että tieto säilyy paremmin pidennetyissä token‑ikkunoissa. Satunnaistamalla kontekstin segmenttien järjestystä opettaja‑oppilas‑koulutusloopissa menetelmä pakottaa mallin oppimaan sijainti‑agnostisia esityksiä kuitenkaan rikkomatta järjestyksen merkitystä, mikä mahdollistaa koherenssin säilymisen kymmenien tuhansien tokenien yli. Läpimurto on merkittävä, koska pitkän kontekstin käsittely on edelleen keskeinen pullonkaula LLM‑malleille, joita käytetään todellisissa sovelluksissa, kuten oikeudellisten sopimusten analysoinnissa, tieteellisen kirjallisuuden tarkastelussa ja monivaiheisessa vuorovaikutuksessa. Nykyiset kiertoratkaisut – liukuvat ikkunat, hakupohjainen generointi tai huomion skaalaaminen 100 k‑tokenin ikkunoihin – joko kuluttavat paljon laskentatehoa tai heikentävät tarkkuutta. “Shuffle the Context” lupaa kevyen sovelluksen, joka voidaan liittää valmiiksi koulutettuihin malleihin ilman täyttä uudelleenkoulutusta, ja jonka odotetaan parantavan tarkkuutta mittareissa kuten LongBench sekä toimialakohtaisissa tehtävissä, jotka vaativat syvällistä päättelyä laajoissa teksteissä. Kuten raportoimme 6 huhtikuuta, fly51fly on ollut aktiivinen ääni X:ssä, jakaen edistysaskeleita ilmaisvoimaisista digitaalisista avatarista koodiin keskittyviin LLM:iin. Tämä viimeisin kontribuutio lisää uutta ulottuvuutta hänen portfolioonsa, kohdistuen ongelmaan, jonka laajempi tekoälyyhteisö pyrkii ratkaisemaan. Mitä kannattaa seurata seuraavaksi: täyden paperin odotetaan ilmestyvän arXiviin muutaman päivän sisällä, mukana avoimen lähdekoodin toteutus. Varhaiset käyttäjät todennäköisesti vertailevat tekniikkaa OpenAI:n 128 k‑token GPT‑4 Turboon ja Anthropicin Claude 2.1:een. Alan tarkkailijat tulisi pitää silmällä, sisällyttävätkö kiinalaiset laboratoriot, kuten Zhipu AI tai Alibaba, “Shuffle the Context” -menetelmän seuraavan sukupolven malleihinsa, ja skaalautuuko menetelmä multimodaalisiin tai hakupohjaisiin putkiin. Jos väitteet pitävät paikkansa, lähestymistavasta voi tulla vakiintunut lisäosa kontekstin laajentamiseen ilman kalliiden, yhä suurempien transformereiden kouluttamisen kustannuksia.

Mastodon — https://mastodon.sayzard.org/@sayzard/116423426360245531 x.com — https://x.com/fly51fly mobile.twitter.com — https://mobile.twitter.com/fly51fly/status/1633950330948927490 piclur.com — https://piclur.com/profile/fly51fly github.com — https://github.com/fly51fly twitter.com — https://twitter.com/fly51fly/status/1671472603880636418

32

scythe@八方塞がり (@keiyotokei) X:ssä

Mastodon +6 mastodon

gpt-5openai

OpenAI on lanseerannut GPT‑5.4‑Pro‑mallin, uuden suorituskykyisen suuren kielimallin, jonka perushinta on 100 USD kuukaudessa. Ilmoituksen on julkaissut X‑käyttäjä @keiyotokei, ja se merkitsee yrityksen pyrkimystä tehdä sen kykenevimmät mallit taloudellisesti saavutettavammiksi sen jälkeen, kun ne olivat aiemmin olleet saatavilla vain premium‑hintaisina yritysasiakkaille. Tämä siirto on merkittävä, koska se kaventaa kuilua huipputeknologian ja pienten yritysten, tutkimuslaboratorioiden sekä edistyneiden harrastajien budjettien välillä. Aiemmin OpenAI:n tehokkaimmat mallit – kuten GPT‑4 Turbo – olivat käytännössä lukittu käyttöperusteisten API-maksujen tai kalliiden yrityssopimusten taakse. Kiinteä 100 dollarin kuukausimaksu tuo “pro‑luokan” mallin monien pohjoismaisten startupien ulottuville, jotka ovat tähän asti joutuneet turvautumaan vanhempiin versioihin tai kilpailijoiden, kuten Anthropicin ja Google Gemini:n, palveluihin. Kehittäjille ennustettava kustannusrakenne helpottaa budjetointia tuotteille, jotka vaativat tasaisia, matalan latenssin vastauksia, kun taas kouluttajat voivat kokeilla edistyneitä kehotustekniikoita ilman pelkoa hallitsemattomista laskuista. Hintamuutos viestii myös laajemmasta markkinastrategiasta. Laajentamalla lippulaivamallinsa käyttäjäkuntaa OpenAI voi kerätä rikkaampaa käyttödataa, hioa turvallisuusvalvontaa ja vahvistaa asemaansa kilpailijoita vastaan, jotka samalla laskevat omia aloitushintojaan. Pohjoismainen tekoälyekosysteemi – jo ennestään vilkas julkisen sektorin pilottien ja yliopistojen spin‑off-yritysten ansiosta – saattaa kokea piikkien nousun prototyyppien käyttöönotossa, aina automatisoidusta asiakaspalvelusta reaaliaikaisiin käännöstyökaluihin, jotka on räätälöity alueen monikielisille markkinoille. Mitä kannattaa seurata seuraavaksi, on se, esittelekö OpenAI token‑läpäisyrajoituksia, lisääkö se yritystason ominaisuuksia, kuten omistettuja instansseja, tai lanseeraa‑ko se “pay‑as‑you‑go” -lisäkerroksen raskaalle käyttäjäkunnalle. Yhtä tärkeä on kilpailijoiden reagointi: hintasota voisi nopeuttaa tehokkaiden LLM:ien leviämistä Euroopassa, kun taas sääntelyvalvonta mallien saavutettavuudesta ja tietojen käsittelystä saattaa vaikuttaa siihen, kuinka nopeasti näitä palveluita voidaan omaksua. Tulevina viikkoina selviää, muuntaako GPT‑5.4‑Pro:n maltillinen hintalappu mitattavissa olevaan tekoälypohjaiseen innovaatiokasvuun Pohjoismaissa.

Mastodon — https://mastodon.sayzard.org/@sayzard/116422981340364339 mobile.twitter.com — https://mobile.twitter.com/keiyotokei/status/1275651441080795138 mobile.twitter.com — https://mobile.twitter.com/keiyotokei/status/1382016076171472899 x.com — https://x.com/team_happofusa x.com — https://x.com/hashtag/八方塞がり mobile.twitter.com — https://mobile.twitter.com/keiyotokei/status/1381869384646291459

32

Mastodon +6 mastodon

Viraalinen julkaisu X‑palvelussa tällä viikolla käynnisti uuden aallon keskustelua siitä, miten teknologiasektori yrittää “kesyttää” suuria kielimalleja (LLM:eja). Viestin on julkaissut tekoälykommentaattori Mikael Sundberg, ja se vertaa nykyaikaisia LLM‑hallinnan yrityksiä Warhammer 40 K:n teknikkopappiin, joka laulaa Konehenkelle: “Ihmiset, jotka yrittävät hallita LLM:eja, ovat vain W40K‑teknikopappeja, jotka rukoilevat Konehenkelle. Lähetä piip.” Tämä leikillinen vertaus sai nopeasti tuhansia tykkäyksiä, uudelleentwiittauksia ja runsaasti kommentteja tutkijoilta, eettisiltä asiantuntijoilta ja harrastajilta. Sundbergin vertaus resonoi pitkään jatkuneen kulttuurisen jännitteen kanssa. Toisaalta yritykset ja sääntelijät ottavat käyttöön turvaverkkoja – esimerkiksi kehotteiden suodatus‑API‑rajapintoja, käyttöpolitiikan tarkastuksia ja nousevia “AI Act” –säännöksiä – joiden tarkoituksena on pitää generatiivinen tekoäly yhteiskunnan normien mukaisena. Toisaalta kehittäjät väittävät, että tällaiset toimenpiteet muistuttavat usein rituaalista taikauskoa enemmän kuin insinööritiedettä, mikä heijastuu Warhammer‑mytologiassa, jossa Adeptus Mechanicus uskoo, että jokainen toimintahäiriö on tyytymätön Konehenki, joka täytyy rauhoittaa seremonioiden avulla. Miksi vertaus on merkittävä, on kaksijakoinen. Ensinnäkin se kiteyttää kasvavan turhautumisen siitä, että ylhäältä tulevat kontrollit saattavat tukahduttaa innovaatiota ilman, että ne käsittelevät perimmäisiä teknisiä haasteita, kuten sovitettavuutta ja tulkittavuutta. Toiseksi meemi‑pohjainen kehys muokkaa julkista keskustelua, muuttaen teknisen politiikkakäsittelyn kulttuuritarinaksi, joka resonoi laajemman, ei‑teknisen yleisön kanssa. Viittaamalla rakastettuun sci‑fi‑universumiin julkaisu madaltaa kynnystä tavallisille ihmisille osallistua monimutkaisiin tekoälyturvallisuuskysymyksiin. Mitä seuraavaksi kannattaa tarkkailla, ovat vaikutukset politiikkapiireissä ja teollisuuden tiekartoissa. Euroopan komission AI Act -konsultaatio, jonka määräaika on myöhemmin tässä kuussa, saattaa viitata “rituaali vs. tiukkuus” –argumenttiin, kun sidosryhmät painottavat selkeämpää, standardeihin perustuvaa noudattamista satunnaisten turvatoimien sijaan. Samaan aikaan suurimmat LLM‑toimittajat ovat ilmoittaneet sisäisistä “vast

Mastodon — https://mastodon.zergy.net/@Enalys/116426597057162048 www.reddit.com — https://www.reddit.com/r/40kLore/comments/1bvnce6/machine_spirits_what_are_they_ steamcommunity.com — https://steamcommunity.com/app/2186680/discussions/0/4298195009695311211/?ctp=2 warhammer40k.fandom.com — https://warhammer40k.fandom.com/wiki/Machine_Spirit wh40k.lexicanum.com — https://wh40k.lexicanum.com/wiki/Machine_spirit www.reddit.com — https://www.reddit.com/r/40kLore/comments/100ibe5/so_in_40k_praying_to_machines_

26

Johtavat mallit ovat nyt “lähes erottamattomia” toisistaan suorituskyvyn suhteen, tutkimus kertoo

Mastodon +6 mastodon

Uusi Stanford Institute for Human‑Centered Artificial Intelligence (HAI) -raportti toteaa, että maailman johtavien kielimallien välinen suorituskykyero on käytännössä kadonnut. Useiden vertailutehtävien sarjassa OpenAI:n GPT‑4‑Turbo, Anthropicin Claude 3, Googlen Gemini 1.5 sekä joukko avoimen painotuksen malleja, kuten Llama 3 ja Mistral‑7B, sijoittuvat kaikki vain muutaman prosenttiyksikön sisään toistensa tuloksista. Tutkimus kuvaa ilmiötä termillä “lähes erottamattomuus” ja toteaa, että avoimen painotuksen mallit ovat nyt “kilpailukykyisempiä kuin koskaan” ja lähestyvät samaa kyvykkyysrajaa. Tämä konvergenssi on merkittävä, koska se kumoaa perinteisen raakan kyvykkyyden ajaman asevarustelukilpailun. Kun pelkät pistemäärät eivät enää erottele toimittajia, kilpailupaine siirtyy toissijaisiin ominaisuuksiin: inferenssikustannukset, viive, hienosäätömahdollisuudet, turvallisuustyökalut ja ekosysteemin lukkiutuminen. Yrityksille tämä tarkoittaa laajempaa valikoimaa ja mahdollisuutta korvata proprietaarinen API avoimen painotuksen vaihtoehdolla menettämättä suorituskykyä. Alan osalta kilpailu todennäköisesti kiristyy laskentatehon tehokkuuden, hinnoittelumallien ja vastuullisen tekoälyn sertifikaattien ympärillä sen sijaan, että se keskittyisi headline‑herättäviin kykyparannuksiin. Kuten raportoimme 17. huhtikuuta, Anthropicin Mythos‑tulosten toistaminen julkisilla malleilla oli jo viitannut kaventuvaan eroon; Stanfordin raportti vahvistaa, että trendi on nyt systeeminen. Seuraavat kuukaudet paljastavat, miten yritykset reagoivat. Seuratkaa seuraavan sukupolven avoimen painotuksen julkaisujen lanseerausta, pilvipalveluntarjoajien hintojen säätöjä sekä uusia vertailusarjoja, kuten HELM 2.0, jotka pyrkivät mittaamaan kustannustehokkuutta ja turvallisuusmittareita. Sääntelyviranomaiset odottavat myös keskittyvänsä läpinäkyvyys‑ ja sovitusstandardeihin, muuttaen nämä kriteerit uusiksi kilpailuvipuiksi markkinassa, jossa raaka suorituskyky ei enää ole erotustekijä.

Mastodon — https://tldr.nettime.org/@remixtures/116422664607009746 arxiv.org — https://arxiv.org/html/2510.01731v2 arxiv.org — https://arxiv.org/html/2509.14223v1 news.ycombinator.com — https://news.ycombinator.com/item?id=43856172 studyfinds.org — https://studyfinds.org/the-ai-scam-that-could-threaten-public-opinion-research/ cybernative.ai — https://cybernative.ai/t/distinguishing-genuine-self-modeling-from-stochastic-dr

26

Kiinalaisen tekoälylaboratorion Zhipu AI uusin suurkielimalle GLM-5 on aiheuttanut kohun

Mastodon +6 mastodon

deepseek

Kiinalainen tekoälylaboratorio Zhipu AI on julkaissut teknisen raportin uusimmasta suurkielimallestaan, GLM-5, ja asiakirja on jo saanut osakseen suurta huomiota kaikkein vaikuttavimpana analyysinä sitten DeepSeek-V3/R1:n. NVIDIA:n arvostetun tutkimustieteilijän Wei Pingin korostama raportti esittelee joukon huomion tehokkuutta parantavia innovaatioita, mukaan lukien hybridisen tehokkaan huomion variantin, harvan huomion mallit ja liukuvälinen mekanismi, joita tukevat laajat ablaatiotutkimukset ja suorituskykyvertailut. Tärkeintä on mallin kyky toimia vertaista tai jopa paremmin samanaikaisesti vähentäen muisti- ja laskentajalanjälkeä jopa 40 prosentilla. Tällaiset edut ratkaisevat osittain suurten, useiden miljardien parametrin mallien koulutuksen ja tarjoamisen kohoavan kustannuksen, pullonkaulan, joka on hidastanut laajempaa käyttöönottoa hyvin rahoitettujen pilvipalvelujen ulkopuolella. Julkaistessaan yksityiskohtaiset kokeelliset tiedot GLM-5:n tiimi tarjoaa tutkimusyhteisölle toistettavissa olevia oivalluksia, jotka voivat kiihdyttää harvan ja paikallistietoisen huomion omaksumista koko LLM-ekosysteemissä. Wei Pingin suositus on merkittävä, sillä hänen työnsä NVIDIA:lla keskittyy laitteistoa vastaavaan mallin suunnitteluun, ja hänen julkiset kehuensa ovat merkkinä siitä, että GLM-5:n tekniikat ovat yhteensopivia yhtiön tulevan H100-yhteensopivan ohjelmistopinon kanssa. Jos tulokset kääntyvät avoimen lähdekoodin muotoon tai integroidaan NVIDIA:n TensorRT-LLM:ään, kehittäjät voivat nähdä välittömän suorituskyvyn parantumisen olemassa olevassa infrastruktuurissa. Seuraavaksi tarkkailtavaksi jää GLM-5:n painojen virallinen julkaisu, odotetut benchmark-tulokset HELM- ja MMLU-suittien osalta sekä mahdolliset yhteistyösopimukset Zhipu AI:n ja laitteiston toimittajien välillä. Yhtä tärkeää on seuraavat tutkimukset, jotka tarkastelevat raportoituja huomiovarianttien skaalaamista triljoonaparametrin järjestelmiin, askel joka voisi muuttaa kilpailukuvaa kiinalaisten ja länsimaiden LLM-kehittäjien välillä.

Mastodon — https://mastodon.sayzard.org/@sayzard/116415417977650089 www.youtube.com — https://www.youtube.com/channel/UCQMZ8SB9-tX8gzXRPR5LBuw www.tiktok.com — https://www.tiktok.com/@weiping1 www.linkedin.com — https://www.linkedin.com/pub/dir/Weiping/+ aguea.net — https://aguea.net/_weiping users.encs.concordia.ca — https://users.encs.concordia.ca/~weiping/

26

Tinder ja Zoom tarjoavat “ihmisen todistuksen” silmänäytteitä torjumaan tekoälyä

Mastodon +6 mastodon

Tinder ja Zoom ovat ilmoittaneet, että ne sisällyttävät silmänäyteteknologian alustoihinsa “ihmisen todistuksen” toimenpiteenä, jonka tavoitteena on hillitä tekoälyn luomaa henkilöllisyysväärintä ja bottitoimintaa. Ominaisuus, jonka on tarkoitus tulla saataville rajoitetussa beta‑versiossa myöhemmin tässä neljänneksessä, tallentaa nopean verkkokalvon kuvion laitteen kameran avulla ja vertaa sitä turvalliseen, laitteessa säilytettävään malliin varmistaakseen, että käyttäjä on elävä henkilö ennen kuin hänelle myönnetään pääsy videopuheluihin tai profiilitoimintoihin. Toimenpide seuraa syvävääntö- ja synteettisen äänen hyökkäyksiä, jotka ovat heikentäneet luottamusta reaaliaikaisiin viestintävälineisiin. Zoom, joka teki yhteistyötä Worldcoinin kanssa biometrisen vahvistuksen osalta tarinassa, jonka käsittelimme 18. huhtikuuta, laajentaa nyt tätä lähestymistapaa laajemmalle kuluttajapohjalle. Tinder, joka kamppailee automatisoitujen “swipe‑farmien” kanssa, jotka turhauttavat match‑mittareita, näkee silmänäytteen keinona suojata aitoa käyttäjävuorovaikutusta ja vähentää petoksiin liittyviä porttikieltoja. Välittömän turvallisuushyödyn lisäksi käyttöönotto herättää merkittäviä yksityisyyskysymyksiä. Biometristen tietojen, kuten verkkokalvon kuvioiden, luokitellaan “herkiksi henkilötiedoiksi” EU:n GDPR:n ja pohjoismaisten tietosuojakehysten mukaan, mikä edellyttää, että yritykset säilyttävät ja käsittelevät näytteet tiukkojen turvatoimien puitteissa. Kriitikot väittävät, että tällaisten tietojen luovuttaminen voittoa tavoittelevalle treffisovellukselle ja videoneuvottelujättiläiselle voisi luoda ennakkotapauksen kaupalliselle biometrisen tiedon keruulle, erityisesti jos näytteitä myöhemmin käytetään mainontaan tai myydään kolmansille osapuolille. Mitä kannattaa seurata seuraavaksi: molemmat yritykset ovat sitoutuneet “vain suostumukseen perustuvaan” osallistumiseen, mutta Ruotsin, Norjan ja Suomen viranomaiset odottavat tarkastelevansa suostumusmekanismeja ennen ominaisuuden lanseerausta. Alan tarkkailijat seuraavat myös käyttäjien omaksumisasteita ja mahdollisia sosiaalisen median reaktioita, jotka voivat vaikuttaa siihen, omaksuvatko muut alustat – kuten Microsoft Teams tai Metan Horizon – vastaavan silmäpohjaisen vahvistuksen. Tämän biometrisen riskin onnistuminen tai epäonnistuminen muokkaa tasapainoa tekoälypohjaisen mukavuuden ja yksityisyyden välillä pohjoismaisessa teknologiaympäristössä.

Mastodon — https://sunny.garden/@greenpete/116421397336510610 mashable.com — https://mashable.com/live/ces-2026-news-live-blog-updates stareintothelightsmypretties.jore.cc — https://stareintothelightsmypretties.jore.cc/tag/analytics/ www.freelancer.com.bd — https://www.freelancer.com.bd/jobs/mobile-app-development/4 www.freelancer.com — https://www.freelancer.com/job-search/freelance-microsoft-azure/ stareintothelightsmypretties.jore.cc — https://stareintothelightsmypretties.jore.cc/tag/robots/

24

Shapley‑arvojen ohjaama adaptiivinen ansamblilearning selitettävään rahoitusrikosten havaitsemiseen Yhdysvaltain sääntelyn noudattamisen validoinnilla

ArXiv +5 arxiv

Tutkijaryhmän, jonka johtajana toimii Mohammad Nasir Uddin, on julkaissut uuden arXiv‑esipainoksen *Shapley Value‑Guided Adaptive Ensemble Learning for Explainable Financial Fraud Detection with U.S. Regulatory Compliance Validation* (arXiv:2604.14231v1). Tässä artikkelissa esitetään adaptiivinen ansambli, joka valitsee dynaamisesti ennustavimmat perusoppijat jokaiselle tapahtumalle ja yhdistää ne SHAP‑pohjaiseen attribuutiokerrokseen, joka tuottaa tapauskohtaiset selitykset. PaySim‑simulaattorin 6,36 miljoonan tapahtuman datasettiä käyttäen tekijät raportoivat 4,2 pisteen parannuksen AUC‑arvossa verrattuna tavalliseen gradienttivahvistettuun vertailumalliin, samalla kun selitykset täyttävät Yhdysvaltain valuutanvalvojan (OCC) auditointikriteerit. Työ on merkittävä, koska rahoitusrikollisuus vie Yhdysvaltain instituutioilta vuosittain yli 32 miljardia dollaria, ja viranomaiset kiristävät ohjausta läpinäkymättömän tekoälyn suhteen. Kuten raportoimme 18. huhtikuuta, OCC ja muut viranomaiset vaativat pankkisektorin riskien valvontaan läpinäkyviä, auditointikelpoisia malleja. Upottamalla Shapley‑arvot suoraan päätösputkeen uusi menetelmä lupaa sekä modernien ansamblien ennustavaa voimaa että noudattamiseen vaadittua jäljitettävyyttä, mikä voi avata laajempaa teko

ArXiv — https://arxiv.org/abs/2604.14231 www.sciencedirect.com — https://www.sciencedirect.com/science/article/pii/S1544612323006815 journals.sagepub.com — https://journals.sagepub.com/doi/10.1177/18724981241289751 www.researchgate.net — https://www.researchgate.net/publication/390235753_Explainable_AI_XAI_for_Fraud_ lrc.perdanauniversity.edu.my — https://lrc.perdanauniversity.edu.my/sdi/shapley-value-guided-adaptive-ensemble-

24

Gmail‑tunnistebridge Claude Coworkissa juuri hajosi

HN +6 hn

claudegooglegpt-5reasoning

Claude Coworkin Gmail‑tunnistebridge on mennyt offline‑tilaan, jättäen tuhannet käyttäjät kykenemättömiksi synkronoimaan sähköpostitunnisteita AI‑ohjatun työtilan kanssa. Vika ilmeni varhain tiistaina, kun integraatio, joka automaattisesti peilaa Gmail‑tunnisteet Claude‑Cowork‑projektitunnisteiksi, alkoi palauttaa 502‑virheitä. Anthropic vahvisti katkoksen tilasivullaan ja selitti sen Google‑Gmail‑API:n äskettäin tehdyn muutoksen aiheuttaman autentikointivirran rikkoutumisen seurauksena. Vika on merkittävä, koska bridge on Claude Coworkin lupauksen kulmakivi muuttaa tavalliset postilaatikot yhteistyökykyisiksi tietopankeiksi. Vetämällä tunnistetiedot Claude‑mallin kontekstin ikkunaan järjestelmä voi tuoda esiin asiaankuuluvia keskusteluketjuja, ehdottaa seuraavia toimenpiteitä ja syöttää mallille ajantasaista tietoa ilman manuaalista kopiointia ja liittämistä. Yritykset, jotka ovat rakentaneet sisäisiä työnkulkuja tämän automaation ympärille, kohtaavat nyt viivästyneitä tikettien reitityksiä, hidastuneita hyväksyntöjä ja ä

HN — https://news.ycombinator.com/item?id=47811466 threadreaderapp.com — https://threadreaderapp.com/user/JafarNajafov zenvanriel.com — https://zenvanriel.com/ai-engineer-blog/ hackernewsday.com — https://hackernewsday.com/ www.classicfilmtvcafe.com — https://www.classicfilmtvcafe.com/2009/10/31-days-of-halloween-one-good-thing.ht www.workerscompensation.com — https://www.workerscompensation.com/additional-education-materials/45270/