Von Abhay Talreja
28.1.2026
Mein neuester Artikel - Empirical Process Control - The Key to Agile Success
T-Shirt-Groessen in Agile: Kompletter Leitfaden zur relativen Schaetzung
T-Shirt-Groessen sind eine agile Schaetzungstechnik, die Kleidergroessen - XS, S, M, L, XL, XXL - anstelle von Zahlen verwendet, um den relativen Aufwand von Arbeitspaketen zu schaetzen. Es ist die schnellste Methode, um ein grosses Backlog zu bewerten, ohne sich in falscher Praezision zu verlieren, und es ist oft die erste Schaetzungstechnik, die neue Agile Teams erlernen.
Warum Kleidergroessen? Weil jeder sofort den Unterschied zwischen einem Small und einem Extra Large versteht. Sie muessen nicht erklaeren, was eine „5" auf einer Fibonacci-Skala bedeutet oder darueber diskutieren, ob etwas eine 6 oder eine 7 ist. Ein T-Shirt ist ein T-Shirt. Diese intuitive Einfachheit ist genau das, was diese Technik so effektiv macht fuer Sprint Planning, Roadmap-Planung und funktionsuebergreifende Gespraeche, in denen nicht jeder die Sprache der Story Points spricht.
Dieser Leitfaden behandelt, wann T-Shirt-Groessen eingesetzt werden sollten (und wann nicht), den schrittweisen Prozess, wie Groessen in numerische Werte umgerechnet werden, haeufige Fehler und wie sie sich im Vergleich zu Planning Poker und anderen Techniken verhalten.
| Aspekt | Details |
|---|---|
| Was es ist | Relative Schaetzung mit Kleidergroessen (XS, S, M, L, XL, XXL) |
| Am besten geeignet fuer | Roadmap-Planung, grosse Backlogs, neue Agile Teams, funktionsuebergreifende Gruppen |
| Geschwindigkeit | 30-60 Sekunden pro Element (vs. 2-5 Min. fuer Planning Poker) |
| Genauigkeit | Mittel - gut fuer relativen Vergleich, nicht fuer praezise Kapazitaetsplanung |
| Wer teilnimmt | Entwickler und optional Stakeholder fuer Roadmap-Schaetzungen |
| Wann einsetzen | Fruehe Planungsphasen, wenn Details duenn und Richtung wichtiger als Termine ist |
| Typische Skala | XS, S, M, L, XL (manche Teams fuegen XXL oder XXS hinzu) |
| Hauptvorteil | Keine Lernkurve - jeder versteht T-Shirt-Groessen sofort |
T-Shirt-Groessen sind eine relative Schaetzungsmethode, bei der Teams Kleidergroessen - typischerweise XS, S, M, L, XL - Product Backlog-Elementen zuweisen, basierend auf deren relativer Komplexitaet, Aufwand und Unsicherheit. Anstatt zu fragen „Wie viele Story Points hat das?" fragt das Team „Ist das ein Small oder ein Large?"
Die Technik funktioniert, weil sie bewusst numerische Praezision vermeidet. Wenn jemand sagt „Das ist ein Medium", versucht niemand, Stunden oder Tage zu berechnen. Das Gespraech bleibt auf den relativen Vergleich fokussiert: „Ist das Erstellen der Passwort-Zuruecksetzungsfunktion groesser oder kleiner als die E-Mail-Benachrichtigungsfunktion, die wir bereits geschaetzt haben?"
Drei psychologische Prinzipien machen T-Shirt-Groessen effektiv:
1. Universelles Verstaendnis Jeder hat schon ein T-Shirt getragen. Das Konzept von Small, Medium und Large erfordert keinerlei Erklaerung. Im Gegensatz dazu verbringen Teams bei Story Points ganze Sitzungen damit, „Was bedeutet eine 5?" zu diskutieren. T-Shirt-Groessen beseitigen diese Einarbeitungshuerde.
2. Natuerliche Kategorien Nur 5-6 Kategorien erzwingen schnelle Entscheidungen. Sie koennen nicht darueber gruebeln, ob etwas eine „6,5 vs. 7" ist - es ist entweder ein Medium oder ein Large. Diese Einschraenkung beschleunigt die Schaetzung erheblich.
3. Reduzierter Ankereffekt Worte tragen weniger numerischen Ballast als Zahlen. Wenn jemand „Large" sagt, faellt es anderen schwerer, sich an einen bestimmten numerischen Wert zu ankern, als wenn jemand „8 Punkte" sagt.
| Aspekt | T-Shirt-Groessen | Story Points (Fibonacci) |
|---|---|---|
| Lernkurve | Keine - sofortiges Verstaendnis | Mittel - braucht 3-5 Sprints zur Kalibrierung |
| Geschwindigkeit pro Element | 30-60 Sekunden | 2-5 Minuten |
| Praezision | Niedrig (5-6 Kategorien) | Mittel (10+ Werte) |
| Velocity-Tracking | Erfordert Umrechnung | Direktes Tracking |
| Am besten fuer | Roadmaps, grosse Backlogs, neue Teams | Sprint Planning, Kapazitaetsprognosen |
| Stakeholder-freundlich | Sehr - auch nicht-technische Personen verstehen es | Weniger - „Was ist eine 8?" |
| Numerische Prognosen | Nicht direkt | Ja - Velocity-basiert |
Wichtige Erkenntnis: T-Shirt-Groessen und Story Points sind keine Konkurrenten - sie ergaenzen sich. Viele Teams verwenden T-Shirt-Groessen fuer die uebergeordnete Roadmap-Schaetzung und rechnen dann in Story Points um, wenn die Arbeit ins Sprint Planning kommt.
Vor Ihrer ersten Sitzung einigen Sie sich darauf, was jede Groesse fuer Ihr Team bedeutet. Es gibt keinen universellen Standard - was zaehlt, ist die Konsistenz innerhalb Ihres Teams.
Eine typische 5-Punkte-Skala:
| Groesse | Bedeutung | Beispiel |
|---|---|---|
| XS | Triviale Aenderung, minimaler Aufwand | Tippfehler beheben, Konfigurationswert aktualisieren |
| S | Klein, gut verstandene Aufgabe | Button hinzufuegen, einfaches Formularfeld |
| M | Mittlere Komplexitaet, klarer Ansatz | Neuer API-Endpunkt mit Validierung |
| L | Gross, mehrere Komponenten beteiligt | Komplettes Feature mit UI + Backend + Tests |
| XL | Sehr gross, erhebliche Unbekannte | Multi-System-Integration, neue Architektur |
Manche Teams fuegen XXL hinzu („zu gross, muss aufgeteilt werden") oder XXS („bereits erledigt, muss nur noch verifiziert werden").
Waehlen Sie ein abgeschlossenes Arbeitspaket fuer jede Groesse. Diese werden zu Ihren Kalibrierungsankern.
Schreiben Sie diese an eine Wand oder in ein gemeinsames Dokument. Verweisen Sie in jeder Schaetzungssitzung darauf.
Der Product Owner beschreibt die User Story oder das Feature kurz:
Halten Sie es auf 1-2 Minuten. T-Shirt-Groessen funktionieren, weil sie schnell sind - machen Sie keine Anforderungsanalyse daraus.
Jedes Teammitglied waehlt privat eine Groesse. Methoden sind:
Der Schluessel: Alle decken gleichzeitig auf, genau wie bei Planning Poker. Dies verhindert den Ankereffekt.
Wenn alle uebereinstimmen (oder innerhalb einer Groesse liegen), notieren Sie die Groesse und machen weiter.
Bei einer grossen Abweichung (z.B. ein S und ein XL) erklaeren die Ausreisser:
Normalerweise loest eine Diskussionsrunde die Differenz. Falls nicht, waehlen Sie die groessere Groesse - das ist sicherer, und man kann spaeter immer noch aufteilen.
Schreiben Sie die T-Shirt-Groesse auf die Story-Karte oder in Ihr Backlog-Tool. Verbringen Sie nicht mehr als 60-90 Sekunden pro Element. Der ganze Sinn ist Geschwindigkeit.
Fuer grosse Backlogs (50+ Elemente): Verwenden Sie die Affinitaetsschaetzungs-Variante. Anstatt jedes Element zu diskutieren, sortieren alle Elemente schweigend in Groessenspalten, und diskutieren dann nur die Elemente, bei denen Teammitglieder unterschiedlicher Meinung sind.
Die haeufigste Frage, die Teams stellen: „Was genau bedeutet jede Groesse?" Hier sind drei Ansaetze.
| Groesse | Ungefaehrer Aufwand | Beteiligte Teammitglieder |
|---|---|---|
| XS | Unter einem halben Tag | 1 Person |
| S | Halber Tag bis 1 Tag | 1 Person |
| M | 1-3 Tage | 1-2 Personen |
| L | 3-5 Tage | 2-3 Personen |
| XL | 1-2 Wochen | Mehrere Personen |
| XXL | Mehr als 2 Wochen - aufteilen | Gesamtes Team |
| Groesse | Komplexitaetsmerkmale |
|---|---|
| XS | Bekannte Loesung, keine Abhaengigkeiten, keine Unbekannten |
| S | Bekannte Loesung, minimale Abhaengigkeiten |
| M | Groesstenteils bekannte Loesung, einige Abhaengigkeiten oder Unbekannte |
| L | Teilweise Unbekannte, mehrere Abhaengigkeiten, komponentenuebergreifend |
| XL | Erhebliche Unbekannte, externe Abhaengigkeiten, neue Muster erforderlich |
| XXL | Zu viele Unbekannte - zuerst Spike oder Aufschluesselung noetig |
Ueberspringen Sie abstrakte Definitionen komplett. Fuehren Sie einfach eine Referenzliste mit 2-3 abgeschlossenen Elementen pro Groesse. Wenn das Team mehr Arbeit abschliesst, aktualisieren Sie die Beispiele. Dies ist der praktischste Ansatz, weil er die Schaetzung in der tatsaechlichen Erfahrung Ihres Teams verankert.
Profi-Tipp: Definieren Sie Ihre Groessen nicht zu detailliert. Der Wert von T-Shirt-Groessen kommt aus ihrer Einfachheit. Wenn Ihre Definitionen eine Tabellenkalkulation benoetigen, um erklaert zu werden, haben Sie den Zweck verfehlt. Drei Aufzaehlungspunkte pro Groesse reichen aus.
Irgendwann brauchen Sie Zahlen - fuer Velocity-Tracking, Kapazitaetsplanung oder Berichte an Stakeholder. So rechnen Sie um.
Lineare Umrechnung (einfachste):
| XS | S | M | L | XL | XXL |
|---|---|---|---|---|---|
| 1 | 2 | 3 | 5 | 8 | 13 |
Dies bildet direkt auf Fibonacci ab, was praktisch ist, wenn Ihr Team spaeter auf Story Points umsteigt.
Gewichtete Umrechnung (spiegelt exponentielles Wachstum wider):
| XS | S | M | L | XL | XXL |
|---|---|---|---|---|---|
| 1 | 3 | 5 | 8 | 13 | 21 |
Dies spiegelt besser die Realitaet wider, dass ein XL nicht einfach „5-mal groesser als ein XS" ist - es ist proportional unsicherer.
Stundenbasierte Umrechnung (fuer zeitfokussierte Teams):
| XS | S | M | L | XL | XXL |
|---|---|---|---|---|---|
| 2h | 4h | 1T | 3T | 1W | 2W+ |
Verwenden Sie dies nur, wenn Ihre Organisation stundenbasierte Berichte erfordert. Die meisten Agile-Praktiker raten davon ab, da es Schaetzung mit Zusage verwechselt.
Umrechnen wenn:
Nicht umrechnen wenn:
| Aspekt | T-Shirt-Groessen | Planning Poker | Affinitaetsschaetzung | Bucket-System |
|---|---|---|---|---|
| Geschwindigkeit pro Element | 30-60 Sekunden | 2-5 Minuten | 10-20 Sekunden | 15-30 Sekunden |
| Beste Stapelgroesse | 20-100 Stories | 10-20 Stories | 50-200 Stories | 30-100 Stories |
| Praezision | Niedrig (5-6 Kategorien) | Mittel (10+ Werte) | Niedrig-Mittel | Mittel |
| Lernkurve | Keine | Mittel | Niedrig | Niedrig |
| Velocity-Tracking | Erfordert Umrechnung | Direkt | Erfordert Umrechnung | Direkt |
| Am besten fuer | Roadmaps, neue Teams | Sprint Planning | Grosse Backlog-Sichtung | Mittlere Backlogs |
| Stakeholder-Freundlichkeit | Sehr hoch | Niedrig | Mittel | Niedrig |
Gaengige Schaetzungsprogression:
Teams muessen T-Shirt-Groessen nicht „entwachsen" - die Technik bleibt auch bei erfahrenen Teams fuer Roadmap-Diskussionen nuetzlich.
T-Shirt-Groessen sind die richtige Wahl wenn:
T-Shirt-Groessen reichen nicht aus wenn:
Verwenden Sie Planning Poker fuer Sprint-Level-Schaetzung. Verwenden Sie Affinitaetsschaetzung, wenn Sie mehr als 50 Elemente sehr schnell schaetzen muessen und bereits eine numerische Skala haben.
T-Shirt-Groessen eignen sich gut fuer Remote-Arbeit, da die Sitzungen kurz und die Skala einfach ist.
Synchron (Videoanruf):
Asynchron (verteilte Zeitzonen):
Jira-Einrichtung:
Miro-Vorlagen-Ansatz:
So sieht es aus: „Ein Medium sind 3 Tage. Das ist ein Medium, also ist es bis Mittwoch fertig."
Warum es ein Problem ist: T-Shirt-Groessen repraesentieren relative Komplexitaet, nicht Kalender-Zusagen. Ein Medium bedeutet „ungefaehr der gleiche Aufwand wie andere Mediums" - keine bestimmte Dauer.
Loesung: Verwenden Sie Groessen fuer relativen Vergleich und Planung. Wenn Sie Termine brauchen, rechnen Sie in Story Points um und verwenden Sie Velocity-basierte Prognosen.
So sieht es aus: Das Team verwendet XS, S, SM, M, ML, L, XL, XXL, XXXL - neun Kategorien.
Warum es ein Problem ist: Mehr Kategorien verfehlen den Zweck. Sie haben numerische Schaetzung mit schlechteren Bezeichnungen neu erfunden. Der Wert von T-Shirt-Groessen ist Geschwindigkeit durch Einschraenkung.
Loesung: Bleiben Sie bei 5 Groessen (XS, S, M, L, XL). Fuegen Sie XXL nur als „zu gross, muss aufgeteilt werden"-Kennzeichnung hinzu.
So sieht es aus: „Ist das ein Medium? Was ist ueberhaupt ein Medium in diesem Team?"
Warum es ein Problem ist: Ohne Kalibrierung koennte dasselbe Feature von einer Person als Small und von einer anderen als Large eingestuft werden. Schaetzungen werden inkonsistent und nutzlos.
Loesung: Waehlen Sie vor Ihrer ersten Sitzung 1-2 abgeschlossene Elemente fuer jede Groesse. Halten Sie diese in jeder Schaetzungssitzung sichtbar.
So sieht es aus: „Ich denke, das ist ein Large." Alle nicken.
Warum es ein Problem ist: Die erste Person, die spricht, ankert alle anderen. Dies zerstoert das unabhaengige Denken, das Gruppenschaetzungen genau macht.
Loesung: Immer gleichzeitig aufdecken - Finger hochhalten, Karten umdrehen oder ein digitales Tool verwenden, das Schaetzungen verbirgt, bis alle abgegeben haben.
So sieht es aus: „Wir haben Kapazitaet fuer ein XL, zwei Ls und drei Ms in diesem Sprint."
Warum es ein Problem ist: Ohne numerische Umrechnung koennen Sie das nicht tatsaechlich ueberpruefen. Entspricht ein XL zwei Ls? Entsprechen zwei Ls drei Ms? Die Mathematik funktioniert nicht ohne die Definition expliziter Verhaeltnisse.
Loesung: Rechnen Sie vor dem Sprint Planning in Story Points um oder akzeptieren Sie, dass T-Shirt-Groessen nur fuer grobe Planung gedacht sind.
So sieht es aus: Das Team hat Groessen vor sechs Monaten definiert. Seitdem ist ihre Codebasis gewachsen, Standards haben sich geaendert, und „Medium" bedeutet nicht mehr das, was es frueher bedeutete.
Warum es ein Problem ist: Die Schaetzungsgenauigkeit nimmt ab, wenn sich der Bezugsrahmen des Teams verschiebt.
Loesung: Ueberpruefen Sie Referenz-Stories jedes Quartal waehrend einer Sprint Retrospective. Aktualisieren Sie Beispiele, um die aktuelle Komplexitaet widerzuspiegeln.
Was Sie erwarten koennen:
Fokus auf:
Was Sie erwarten koennen:
Fokus auf:
Was Sie erwarten koennen:
Fokus auf:
Schaetzung einer Quartals-Roadmap:
Wie sie es nutzen: Product Manager und Engineering Lead schaetzen die Features des naechsten Quartals in einer 30-minuetigen Sitzung. Das Ergebnis fliesst in die Kapazitaetsverteilung ein: „Wir koennen ein XL, zwei Ls und mehrere S/M-Elemente dieses Quartal unterbringen."
Schaetzung eines Product Backlogs:
Wie sie es nutzen: Waehrend der Release-Planung schaetzt das Team 80+ Backlog-Elemente in unter einer Stunde. Sie rechnen nur fuer die Elemente in Story Points um, die in die naechsten zwei Sprints eingehen.
Schaetzung compliance-bezogener Features:
Wie sie es nutzen: Der Compliance-Beauftragte nimmt an T-Shirt-Groessen-Sitzungen teil, weil die Skala intuitiv ist. Er markiert: „Jedes L oder XL, das PHI beruehrt, braucht zuerst einen Compliance-Review-Spike."
Schaetzung eines Feature-Backlogs fuer iOS und Android:
Wie sie es nutzen: Plattformunterschiede bedeuten, dass dasselbe Feature unterschiedliche Groessen haben kann. „Biometrisches Login ist ein Small auf iOS (Face ID ist gut dokumentiert), aber ein Medium auf Android (fragmentierte Hardware-Unterstuetzung)."
Schaetzung von Kundenprojekt-Angeboten:
Wie sie es nutzen: Vertriebs- und Delivery-Teams verwenden T-Shirt-Groessen in Angeboten. „Dieses Projekt ist ein Large basierend auf unseren Referenzprojekten" gibt Kunden und Delivery-Teams ein gemeinsames Verstaendnis, bevor die detaillierte Schaetzung beginnt.
Vor der Sitzung:
Waehrend der Sitzung:
Nach der Sitzung:
Moderationstipps:
T-Shirt-Groessen funktionieren, weil sie Praezision gegen Geschwindigkeit und Zugaenglichkeit eintauschen. Sie brauchen in der fruehen Planung keine Praezision - Sie brauchen Richtung. Ist dieses Feature ein kleiner Aufwand oder ein grosser? Diese Antwort eroeffnet Roadmap-Gespraeche, Kapazitaetsplanung und Backlog-Priorisierung ohne den Aufwand detaillierter Schaetzung.
Wichtigste Erkenntnisse:
Beginnen Sie damit, Ihr aktuelles Backlog in einer einzigen 30-minuetigen Sitzung zu schaetzen. Sie werden ueberrascht sein, wie viel Klarheit ein einfaches Small/Medium/Large-Gespraech schafft - und wie schnell Ihr Team vorankommen kann, wenn Schaetzung aufhoert, sich wie eine laestige Pflicht anzufuehlen.
Wie vergleichen sich T-Shirt-Groessen mit dem Bucket-System fuer die Agile Schaetzung?
Koennen T-Shirt-Groessen fuer Nicht-Software-Projekte wie Marketing oder Veranstaltungsplanung verwendet werden?
Was ist der psychologische Grund, warum T-Shirt-Groessen schnellere Schaetzungen liefern als Zahlen?
Wie gehen Sie effektiv mit Meinungsverschiedenheiten waehrend T-Shirt-Groessen-Sitzungen um?
Koennen T-Shirt-Groessen zusammen mit SAFe (Scaled Agile Framework) fuer die Unternehmensplanung funktionieren?
Welche Tools unterstuetzen T-Shirt-Groessen in Jira, und wie richtet man sie ein?
Wie genau sind T-Shirt-Groessen im Vergleich zu Planning Poker und Story Points?
Wie verhindert man, dass T-Shirt-Groessen-Definitionen ueber mehrere Teams hinweg inkonsistent werden?
Was ist die Beziehung zwischen T-Shirt-Groessen und dem Konzept der relativen Schaetzung in Agile?
Wie vollzieht man den Uebergang eines Teams von T-Shirt-Groessen zu Story Points, ohne den Schwung zu verlieren?
Wie gehen T-Shirt-Groessen mit Elementen um, die hohe Unsicherheit vs. hohen Aufwand haben?
Koennen T-Shirt-Groessen datengetriebene Prognosen unterstuetzen, oder sind sie nur fuer grobe Planung nuetzlich?
Wie setzt man T-Shirt-Groessen effektiv fuer ein Produkt mit sowohl technischen Schulden als auch Feature-Arbeit ein?
Welche Rolle spielt der Product Owner in T-Shirt-Groessen-Sitzungen?
Sind T-Shirt-Groessen mit der #NoEstimates-Bewegung in Agile kompatibel?