Causal Proxy Models

university

https://github.com/frankaging/Causal-Proxy-Model

Activity Feed Request to join this org

AI & ML interests

Causal Proxy Models For Concept-Based Model Explanations

Recent Activity

zhengxuanzenwu authored a paper 9 months ago

Rigorously Assessing Natural Language Explanations of Neurons

zhengxuanzenwu authored a paper 9 months ago

MQuAKE: Assessing Knowledge Editing in Language Models via Multi-Hop Questions

zhengxuanzenwu authored a paper 9 months ago

A Reply to Makelov et al. (2023)'s "Interpretability Illusion" Arguments

View all activity

CPMs's activity

zhengxuanzenwu

authored 7 papers 9 months ago

pyvene: A Library for Understanding and Improving PyTorch Models via Interventions

Paper • 2403.07809 • Published Mar 12 • 1

DynaSent: A Dynamic Benchmark for Sentiment Analysis

Paper • 2012.15349 • Published Dec 30, 2020

CEBaB: Estimating the Causal Effects of Real-World Concepts on NLP Model Behavior

Paper • 2205.14140 • Published May 27, 2022

KarelDO

authored a paper over 1 year ago

Causal Proxy Models for Concept-Based Model Explanations

Paper • 2209.14279 • Published Sep 28, 2022

zhengxuanzenwu

authored 2 papers over 1 year ago

Causal Proxy Models for Concept-Based Model Explanations

Paper • 2209.14279 • Published Sep 28, 2022

Interpretability at Scale: Identifying Causal Mechanisms in Alpaca

Paper • 2305.08809 • Published May 15, 2023 • 2

KarelDO

updated 10 models about 2 years ago

CPMs/cpm.in.lstm.inclusive.seed66

Updated Oct 14, 2022 • 7

CPMs/cpm.in.lstm.approximate.seed66

Updated Oct 14, 2022 • 7

CPMs/cpm.in.lstm.approximate.seed77

Updated Oct 14, 2022 • 6

CPMs/cpm.in.lstm.inclusive.seed42

Updated Oct 14, 2022 • 7

CPMs/cpm.in.lstm.inclusive.seed77

Updated Oct 14, 2022 • 6

CPMs/cpm.in.lstm.approximate.seed42

Updated Oct 14, 2022 • 7

CPMs/cpm.in.gpt2.approximate.seed42

Updated Oct 14, 2022 • 6

CPMs/cpm.in.gpt2.inclusive.seed77

Updated Oct 14, 2022 • 6

CPMs/cpm.in.gpt2.inclusive.seed42

Updated Oct 14, 2022 • 7

CPMs/cpm.in.gpt2.approximate.seed77

Updated Oct 14, 2022 • 7

AI & ML interests

Recent Activity

Team members 2

CPMs's activity