Skip to content

docs(rfc): RFC 0004 — DataFrame und Blob (Content-Layer vs. Multi-Format)#73

Merged
lepy merged 1 commit into
masterfrom
docs/rfc-dataframe-blob
Jun 29, 2026
Merged

docs(rfc): RFC 0004 — DataFrame und Blob (Content-Layer vs. Multi-Format)#73
lepy merged 1 commit into
masterfrom
docs/rfc-dataframe-blob

Conversation

@lepy

@lepy lepy commented Jun 29, 2026

Copy link
Copy Markdown
Owner

Analyse-RFC (Status: Proposed, kein Code) als Abschluss von RFC 0003: soll DataFrame auf Blob erben?

Befund

Nein. Das Blob-Modell (ein fixer Content-Blob) passt schlecht auf das DataFrame-Modell (eine lebende pandas-Tabelle, on-demand in viele Formate kodierbar — Parquet/Arrow/Feather/CSV/dict/JSON-LD/HDF5/Data Package).

Optionen

  • A Vererbung DataFrame(Blob)verworfen: bricht das to_dict-Layout (data.parquet_bytes/column_metadata vs. data.content), Sync-Problem (lebende df), mehrdeutige Hash-Semantik.
  • B Integritäts-/Provenienz-Mixin — gemeinsamer Hash-/verify-Layer für Blob und DataFrame, additiv.
  • C Komposition DataFrame.as_blob(fmt="parquet") -> Blob — Tabelle bei Bedarf als Blob in jedem Format ausgeben; null Bruchrisiko.
  • D Status quo.

Empfehlung

Komposition (C) als primärer Weg, optional ergänzt um den Mixin (B); keine Vererbung. Klärt die „Grundlage aller Datenformate" als gemeinsamen Layer (single-content erbt, mehrformatig komponiert), nicht als zwingende Basisklasse. Inkl. Testplan + offene Punkte (Prüfsummen-Determinismus bei Parquet, Default-Format).

In die mkdocs-RFC-Navigation aufgenommen; mkdocs build --strict exit 0.

…mat)

Analyse (Status: Proposed), ob DataFrame auf Blob erben soll. Befund: nein — das
Blob-Modell (ein fixer Content-Blob) passt schlecht auf die lebende, in viele
Formate kodierbare pandas-Tabelle. Optionen A (Vererbung, verworfen: to_dict-Bruch,
Sync-Problem, Hash-Mehrdeutigkeit), B (Integritäts-Mixin), C (Komposition
DataFrame.as_blob(fmt)), D (Status quo). Empfehlung: Komposition (C) + optional
Mixin (B), keine Vererbung. Klärt die "Grundlage" als gemeinsamen Layer statt
zwingender Basisklasse. In die mkdocs-RFC-Navigation aufgenommen.
@lepy lepy merged commit 92de37c into master Jun 29, 2026
@lepy lepy deleted the docs/rfc-dataframe-blob branch June 29, 2026 13:04
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant