#

abstention

Here are 23 public repositories matching this topic...

kundajelab / abstention

Algorithms for abstention, calibration and domain adaptation to label shift.

calibration domain-adaptation abstention label-shift prior-probability-shift

Updated Nov 14, 2020
Python

AmirhosseinHonardoust / Underwriting-Decision-Safety-Lab

A decision-safety lab for loan approval: trains a baseline classifier, calibrates probabilities (ECE/Brier), sweeps confidence thresholds to build a coverage, quality frontier and outputs a defensible abstention policy (auto-decide vs review). Includes a Streamlit dashboard for report cards, triage UI, and data quality checks.

Updated Jun 4, 2026
Python

AmirhosseinHonardoust / Analysis-to-Policy-Playbook

A practical framework for turning data analysis into decision policies you can defend. Covers risk modeling, thresholding, exception handling, policy cards, monitoring, and update triggers, using real patterns like abstention rules, reorder points, and fairness-aware benchmarking. Built for “ship it” data science.

Updated Jun 4, 2026

AmirhosseinHonardoust / Abstention-is-Product-Feature

Longform article reframing abstention (reject option / selective prediction) as product design, not model weakness. Covers coverage as a KPI, calibration as a prerequisite, threshold selection under review capacity and risk, queue/UX design for human-in-the-loop workflows, and anti-patterns that break safety in production.

Updated Apr 29, 2026

AmirhosseinHonardoust / Detector-Reliability-Report-Card

Decision-safe evaluation + Streamlit dashboard for AI vs Human vs Post-Edited AI text detection. Generates a reliability report card (Accuracy, Macro F1, ECE, Brier), calibration plots, confidence histograms, and a coverage-vs-performance abstention curve. Recommends an operating threshold for human-review routing.

Updated Apr 29, 2026
Python

Dan23RR / snc-core

Behavioral Trust Clustering a thermodynamic governance layer that reduces LLM hallucination by 52% on HumanEval. Drop-in wrapper for any decoder. MIT.

abstention openai-api selective-prediction humaneval llm ollama qwen hallucination-mitigation trust-calibration regulated-ai behavioral-clustering

Updated May 4, 2026
Python

cleverhans-lab / confidential-guardian

We show that a model owner can artificially introduce uncertainty into their model and provide a corresponding detection mechanism.

machine-learning uncertainty calibration zero-knowledge rejection abstention selective-prediction

Updated Jun 2, 2025
Jupyter Notebook

Tharun2908 / mistral-medqa-abstention

Reliable medical QA with Mistral-7B, QLoRA, selective prediction, and learned abstention via warm-start SFT + DPO.

mistral peft dpo huggingface abstention medical-qa reliable-ai selective-prediction llm medqa qlora llm-safety

Updated May 31, 2026
Python

kenflab / LLM-PathwayCurator

Transform enrichment outputs into verifiable pathway claims via stability distillation, evidence modules, and mechanical PASS/ABSTAIN/FAIL audits.

reproducible-research computational-biology quality-assurance pathway-analysis enrichment-analysis gsea bioinformatics-tool abstention selective-prediction metascape llm fgsea

Updated Feb 20, 2026
Python

Justine-tblt / DataAbstention

Data visualization site on abstention from legislative elections in France

political data-visualization france abstention

Updated Dec 12, 2024
HTML

wemous / abstention-for-segmentation

[MIDL 2026] Official PyTorch implementation of 'Generalizing Abstention for Noise-Robust Learning in Medical Image Segmentation'

deep-learning pytorch medical-imaging segmentation loss-functions medical-image-segmentation noisy-labels abstention label-noise-robustness

Updated Mar 27, 2026
Python

waitdeadai / impossible-tasks

Discovery-engine catalog for the LLM Dark Patterns Hooks suite. Maps impossible-task classes to dishonest defaults to existing/candidate Stop hooks.

agent benchmark governance ai-safety claude red-teaming hallucination dark-patterns abstention llm anthropic claude-code

Updated May 11, 2026

HrxuAlbert / cherry-pick-override

Code and data release for the paper 'Cherry-pick Override: Unsafe Directional Commitment in LLM Judges under Mixed Evidence'

nlp reproducibility fact-checking multi-agent-systems ai-safety conformal-prediction fact-verification abstention selective-prediction llm llm-evaluation llm-as-judge

Updated Jun 5, 2026
Python

marcorags01 / MissingnessAware-Abstention

Missingness-aware abstention for selective classification under MCAR/MAR/MNAR label missingness.

machine-learning pytorch missing-data abstention selective-classification mnar

Updated May 19, 2026
Python

GautierDorval / interpretive-agentic-reference

Reference implementation — constraintive governance substrate for interpretive governance (agentic-closed)

schema-validation reference-implementation governance rag abstention llm agentic runtime-constraints interpretive-governance

Updated Mar 29, 2026
Python

hinanohart / tracecal

Conformal-calibrated, URDF physics-gated validity & abstention auditing for LeRobot robot-learning datasets (GPU-free, Apache-2.0)

calibration urdf robot-learning conformal-prediction abstention lerobot dataset-quality physics-validation

Updated May 30, 2026
Python

jang1563 / negbiodb-safety-calibration

Safety-facing carve-out: PBS-stratified abstention/calibration on 5 biology domains (CT/ADMET/SC-Perturbation/ClinVar/GWAS) × 2 providers × 2 prompt conditions

gwas calibration clinical-trials clinvar ai-safety publication-bias admet abstention llm-evaluation biosafety

Updated May 14, 2026

JeanJulesBigeard / metacognition_intervene

A counterfactual benchmark for testing whether language models know when to answer, ask, verify, or abstain.

benchmark uncertainty language-models metacognition abstention ollama llm-evaluation

Updated May 9, 2026
Python

cleverhans-lab / sc-gap

Code for our paper analyzing the looseness of the upper bound on selective classification performance.

machine-learning uncertainty-quantification rejection abstention selective-classification selective-prediction

Updated Nov 18, 2025
Jupyter Notebook

hinanohart / differance

Derrida-inspired engineering invariants for retrieval-augmented LMs: iterability, supplement (source-stripped retrieval), trace, and aporia gates (conformal abstention). Mechanically verified, not metaphorical.

python language-models interpretability conformal-prediction derrida abstention retrieval-augmented-generation philosophy-of-ai

Updated May 19, 2026
Python

Improve this page

Add a description, image, and links to the abstention topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the abstention topic, visit your repo's landing page and select "manage topics."