En prognos med en motpart A forecast with an adversary
En sportarena i en av CoordiNet-piloterna ska ha tänt all sin belysning under timmen före ett mätfönster för flexibilitet, och sedan släckt igen när marknaden avropade. På pappret hade den levererat en stor reduktion, men i praktiken hade ingen nytta gjorts, eftersom neddragningen mättes mot en nivå den just hade drivit upp med flit. Leverantören fick ändå betalt. Historien spreds bland de andra deltagarna, och den gjorde mer skada än summan det handlade om: den visade alla att det som mäts går att flytta.
Det som mäts är baselinen, eller referensplanen: den konsumtion eller produktion en flexibilitetsleverantör skulle ha haft om marknaden aldrig avropat. Varje ersättning avräknas mot den. Man får inte betalt för mätvärdet under en aktivering; man får betalt för skillnaden mellan baselinen och det mätvärdet. Baselinen är alltså inte en bokföringsdetalj; den är grunden för intäkten.
Det luriga är att baselinen är en prognos för någonting som aldrig inträffar. Det kontrafaktiska (vad man skulle ha förbrukat) är till sin natur omätbart: i samma ögonblick som marknaden aktiverar försvinner den alternativa tidslinjen, och ingen mätare kan återskapa den. En vanlig lastprognos bedöms åtminstone mot ett utfall som förr eller senare kommer. En baseline gör aldrig det. Den är en prognos med en motpart, vilket förändrar vad som menas med en “bra” baseline. Marknadens fråga är inte hur nära baselinen hamnar den faktiska förbrukningen; den är om metoden är neutral och omberäkningsbar. En baseline som ligger några procent för högt är inte ett litet fel som jämnar ut sig. Den ger betalt, vid varje enskilt tillfälle, för en neddragning som aldrig skett.
Därför är metodvalet ett prissättningsbeslut förklätt till ett mätbeslut. Den renaste illustrationen är den brittiska standardregeln: medelvärdet av de X högsta förbrukningsdygnen bland de senaste Y tillämpliga. Den är enkel, transparent och lätt att granska, vilket är reella förtjänster; den är också systematiskt överskattad, eftersom att välja de högsta dygnen också är att välja de dygn som gynnar leverantören mest. Sverige har i stort sett hållit den utanför den publika regelboken: sthlmflex via NODES stannade vid ett platt femdagars rullande medelvärde, och SWITCH dokumenterar meter-before-after (MBMA), en egen referensplan eller en nollreferens. MBMA, som läser timmen före och timmen efter aktiveringen, är i många fall korrekt för en last som drar ner konsumtion; men för ett batteri som levererar flexibilitet genom att mata in öppnas arena-greppet på nytt på en enskild resurs: ladda ur några minuter före avläsningen, så sjunker den synbara baselinen och leveransen överskattas. Rätt metod är istället en nollreferens, där all inmatning räknas och det inte finns något att arrangera i förväg.
Samma asymmetri kan observeras även på marknadens andra sida, vilket är värt att dröja vid. En nätägare som upphandlar flexibilitet möter spegelbilden av leverantörens problem. Leverantörens dyra misstag är att lova flex den inte kan leverera, så den justerar diskret nedåt på det den erbjuder. Nätägarens dyra misstag är att underskatta en topp och missa trängseltimmen, så den överskattar hellre efterfrågan och avropar marknaden tidigare och bredare än en neutral prognos skulle. Båda parter överger den ärliga mittpunkten och rör sig mot den kvantil som skyddar dem mot det fel som svider mest ekonomiskt. Från det perspektivet är “försäkringskostnaden” för nätägaren (tillgänglighet betald för kapacitet som aldrig behövdes) inte slöseri. Den är priset för att ha fel åt det billiga hållet i stället för det dyra.
Det är frestande att tro att hela problemet kan designas bort med en kapacitetstaksprodukt: sätt ett effekttak i anslutningspunkten, validera mot taket och hoppa över det kontrafaktiska helt. EU-kommissionens studie från 2025 förordar precis detta, och för lågspänningsträngsel där undermätning är opraktisk är det rätt strategi. Men baselinen smyger sig gärna tillbaka bakvägen, eftersom taket oftast definieras som en minskning från förväntad förbrukning, vilket är det kontrafaktiska i annan skepnad. NODES MaxUsage hos Effekthandel Väst är det svenska exemplet: produkten ser baselinefri ut på ytan, men dess värde mäts mot en historisk förbrukningsreferens som glider i takt med att beteende och effektivitet ändras. Kinnekulle Energi avvecklade produkten av just det skälet, samtidigt som Effekthandel Väst skalade upp den. En kapacitetstaksprodukt tar bort baselinen från avräkningen, inte från värderingen, om inte taket förankras i något fast (avtalad kapacitet, exempelvis) i stället för i vad kunden brukade ta ut.
Det regulatoriska svaret, när det kommer, är ett erkännande av allt detta. Network Code on Demand Response (art. 14) kräver att baseline-metoder ska vara omberäkningsbara, transparenta, precisa, träffsäkra och neutrala, och att varje godkänd nationell metod förs in i ett register. En baseline är ett finansiellt instrument, och instrument behöver uttalade regler för hur de prissätts. SWITCH nådde samma slutsats operativt: efter en riskbedömning 2022/23 flyttades kontrollen över resursdata från leverantören till nätägaren, och baseline-värden låstes så snart en affär gjorts på marknaden. Referensen togs ur händerna på den part som mäts.
Fokus framåt har skiftat från algoritmiska överväganden till grundläggande ansvarsfördelning. Den viktigaste frågan är inte längre vilken medelvärdesregel som är bäst lämpad; det är vem som beräknar baselinen, och utifrån vems data. Kundens rätt att installera en dedikerad mätare (EMD-reformen art. 7b), och den centrala datainfrastruktur som Ei och Svk ska specificera, pekar åt samma håll: den som har ren mätning på enhetsnivå har referensen, och den som har referensen har avräkningen. Arena-fallet skulle aldrig lösas av en bättre prognos. Det löses genom att man, innan några pengar byter händer, bestämmer vem som får hålla i pennan.
A sports arena in one of the CoordiNet pilots is said to have switched on all of its lighting in the hour before a flexibility measurement window, and then switched it off again when the market called. On paper it had delivered a large reduction, but in practice it had achieved nothing, because the reduction was measured against a level it had just inflated on purpose. The provider was paid anyway. The story circulated among the other participants, and it did more damage than the sum involved: it told everyone that the thing being measured could be moved.
That thing is the baseline: the consumption or production a flexibility provider would have had if the market had never called. Every flexibility payment is settled against it. You are not paid for the meter reading during an activation; you are paid for the gap between the baseline and that reading. So the baseline is not an accounting detail; it is the basis for the revenue.
What makes this tricky is that the baseline is a forecast of something that never happens. The counterfactual (what you would have consumed) is, by construction, unobservable: the instant the market activates, the alternative timeline is gone, and no meter can recover it. Ordinary load forecasting at least gets graded against an outcome that eventually arrives. A baseline never does. It is a forecast with an adversary, which changes what is meant by a “good” baseline. The market’s question is not how close the baseline lands to actual consumption; it is whether the method is unbiased and recalculable. A baseline that sits a few percent high is not a small error that averages out. It pays you, every single event, for a reduction you did not make.
This is why the choice of method is a pricing decision dressed up as a measurement one. The clean illustration is the standard British rule: the average of the X highest-demand days out of the last Y eligible. It is simple, transparent and easy to audit, which are real virtues. It is also systematically high by design, because selecting the highest days is also selecting the days most favourable to the provider. Sweden has mostly kept this out of the public rulebook: sthlmflex using NODES settled on a flat five-day rolling average, and SWITCH documents meter-before-after (MBMA), an own reference plan, or a zero reference. MBMA, which reads the hour before and the hour after the activation, is in many cases correct for a load reducing consumption, but for a battery providing flexibility by injecting, it reopens the arena trick at the level of a single device: discharge for a few minutes before the reading, and the apparent baseline drops, and the delivery is overstated. The correct method is instead a zero reference, where any injection counts and there is nothing to pre-arrange.
The same asymmetry can be seen on the other side of the market, which is worth sitting with. A DSO procuring flexibility faces the mirror image of the provider’s problem. The provider’s expensive mistake is to promise flex it cannot deliver, so it quietly adjusts down what it offers. The grid operator’s expensive mistake is to under-forecast a peak and miss the congestion hour, so it would rather overestimate demand and call the market earlier and wider than a neutral forecast would. Both parties abandon the honest midpoint and move toward the quantile that protects them from the error that hurts most financially. Seen that way, the grid owner’s “insurance cost” (availability paid for capacity that was never needed) is not waste. It is the price of being wrong in the cheap direction instead of the expensive one.
It is tempting to think the whole problem can be designed away with a capacity-limit product: cap the connection point at an agreed power level, verify against the cap, and skip the counterfactual entirely. The European Commission’s 2025 study endorses exactly this, and for low-voltage congestion where sub-metering is impractical it is the right move. But the baseline tends to creep back in through the side door, because the cap is usually defined as a reduction from expected consumption, which is the counterfactual in another guise. NODES’ MaxUsage at Effekthandel Väst is the worked Swedish example: the headline product looks baseline-free, yet its value is benchmarked against a historical-consumption reference that drifts as behaviour and efficiency change. Kinnekulle Energi discontinued the product for precisely that reason, even as Effekthandel Väst scaled it. A capacity-limit product removes the baseline from settlement, not from valuation, unless the cap is anchored to something firm (contracted capacity, say) rather than to what the customer used to draw.
The regulatory answer, when it lands, is an admission of all this. The Network Code on Demand Response (Art. 14) asks that baseline methods be recalculable, transparent, precise, accurate and unbiased, and that every approved national method sit in a register. A baseline is a financial instrument, and instruments need stated rules about how they are priced. SWITCH reached the same conclusion operationally: after a 2022/23 risk assessment, control over resource data was moved from the provider to the DSO, and baseline values were locked once a trade had occurred. The reference was taken out of the hand of the party being measured.
The focus going forward has shifted from algorithmic considerations to a more fundamental allocation of responsibility. The key question is no longer which averaging rule is best suited; it is who computes the baseline, and from whose data. The customer’s right to install a dedicated measuring device (EMD Reform Art. 7b), and the central data backbone that Ei and Svk are due to specify, both point the same way: whoever holds clean, device-level metering holds the reference, and whoever holds the reference holds the settlement. The arena case was never going to be fixed by a better forecast. It is fixed by deciding, before any money changes hands, who gets to hold the pen.