Spaces:

walkenho
/

meeting-attendance-organizer

Runtime error

App Files Files Community

Jessica Walkenhorst commited on Apr 10, 2023

Commit

fbc21be

•

1 Parent(s): 4ac520e

Feature/add UI (#6)

Browse files

* Add first version of streamlit ui
* Add a new test
* Add to Makefile

Files changed (8) hide show

Makefile +6 -1
app.py +72 -0
poetry.lock +28 -1
pyproject.toml +1 -0
src/maorganizer/datawrangling.py +25 -15
src/maorganizer/ui.py +140 -0
tests/test_attendancelist.py +15 -6
tests/test_datawrangling.py +1 -1

Makefile CHANGED Viewed

@@ -1,3 +1,6 @@
 isort:
 	./bin/run-isort.sh
@@ -7,7 +10,9 @@ flake8:
 black:
 	./bin/run-black.sh
 test:
 	poetry run pytest
-prepare: isort black flake8 test

+ui:
+	poetry run streamlit run ui.py
 isort:
 	./bin/run-isort.sh
 black:
 	./bin/run-black.sh
+tidy: isort black flake8
 test:
 	poetry run pytest
+prepare: tidy test

app.py ADDED Viewed

	@@ -0,0 +1,72 @@

+from pathlib import Path
+import streamlit as st
+from maorganizer.datawrangling import Person
+from maorganizer.ui import TASKS, render_xlsx_download_button, create_file_uploader, create_task_selector
+st.title("📅 Meeting Attendance Organizer")
+st.markdown("This app fullfills a simple need: Take a list of names of people attending a meeting and peform one (or multiple) of the following tasks:")
+st.markdown("""* ✂️ Split their names into first name and surname\n* 👀 Compare two lists with each other and see who is new on the second list\n * 🔎 Find people in a list by either searching for their complete names or parts of their name\n * 💾 Write any of the results back out, so you can share it with others""")
+st.header("📂 Step 1: Upload your Files")
+st.markdown("Upload the file(s) containing your meeting attendees. The expected format is a single column containing the attendees' full names. If you column name is not Name, you will be able to specify the column name after uploading the data. Additional columns will be ignored.")
+meetings = {}
+meetings = create_file_uploader()
+task = create_task_selector()
+st.header("🔥 Step 3: Let's Go!")
+st.subheader(f"You are going to ... {task}")
+if not meetings:
+    st.info("⬆ You need to upload some data first ⬆")
+if meetings:
+    if task == TASKS.SPLIT.value:
+        filename = st.selectbox("Choose a file 📄", options=list(meetings.keys()), key=task)
+        #filename = render_file_selector(meetings, key=task)
+        render_xlsx_download_button({'Full list of Attendees': meetings[filename]},
+                                      filename=f"processed-attendees-{Path(filename).stem}.xlsx",
+                                      key=TASKS.SPLIT.value+'download')
+    elif task == TASKS.FIND.value:
+        filename = st.selectbox("📄 Choose a file", options=list(meetings.keys()), key=task)
+        attendees = meetings[filename]
+        textinput = st.text_input("🔎 Who are you looking for? If you are looking for more than one, separate them by comma.")
+        st.markdown("⚠️ By default, the algorithm will surface any names that contain your search terms as substrings (e.g. if you search for Jon, it will surface both Jon and Jonathan). Tick the box below in case you want to display only entries where one of the names matches your search string exactly.")
+        st.markdown("⚠️⚠️ Note that either way the search is case-insensitive.")
+        exact_match = st.checkbox("Find Exact Name")
+        if textinput.strip():
+            st.header("Search Results")
+            if exact_match:
+                people_to_find = [Person(word.strip()) for word in textinput.split(',')]
+                for to_find, found in attendees.find_people(people_to_find).items():
+                    st.subheader(f"**{to_find.name}**")
+                    st.markdown(f"{', '.join([p.name for p in found]) if found else 'Sorry, none found.'}")
+            else:
+                words_to_find = [word.strip() for word in textinput.split(',')]
+                for word_to_find, people_found in attendees.find_words(words_to_find).items():
+                    st.subheader(f"**{word_to_find}**")
+                    st.markdown(f"{', '.join([p.name for p in people_found]) if people_found else 'Sorry, none found.'}")
+    elif task == TASKS.COMPARE.value:
+        col1, col2 = st.columns(2)
+        with col1:
+            filename_old = st.selectbox("Choose your original file", options=list(meetings.keys()), key=task)
+        with col2:
+            filename_new = st.selectbox("Choose your updated file", options=set(meetings.keys()) - {filename_old})
+        listcomparison = (
+        {'Original List': meetings[filename_old],
+         'Updated List - Full': meetings[filename_new],
+         'Updated List - Only Updates': meetings[filename_old].update(meetings[filename_new])})
+        render_xlsx_download_button(listcomparison, filename=f"{Path(filename_old).stem}-updated.xlsx", key=TASKS.COMPARE.value+'download')

poetry.lock CHANGED Viewed

@@ -308,6 +308,14 @@ category = "main"
 optional = false
 python-versions = ">=3.6"
 [[package]]
 name = "exceptiongroup"
 version = "1.1.0"
@@ -1089,6 +1097,17 @@ category = "main"
 optional = false
 python-versions = ">=3.8"
 [[package]]
 name = "packaging"
 version = "23.0"
@@ -1865,7 +1884,7 @@ testing = ["flake8 (<5)", "func-timeout", "jaraco.functools", "jaraco.itertools"
 [metadata]
 lock-version = "1.1"
 python-versions = "^3.10"
-content-hash = "4994be222a316473241cb32a1ada1e927f3cd5f6e9b6afad67bd2e79a07180c7"
 [metadata.files]
 aiofiles = [
@@ -2181,6 +2200,10 @@ entrypoints = [
     {file = "entrypoints-0.4-py3-none-any.whl", hash = "sha256:f174b5ff827504fd3cd97cc3f8649f3693f51538c7e4bdf3ef002c8429d42f9f"},
     {file = "entrypoints-0.4.tar.gz", hash = "sha256:b706eddaa9218a19ebcd67b56818f05bb27589b1ca9e8d797b74affad4ccacd4"},
 ]
 exceptiongroup = [
     {file = "exceptiongroup-1.1.0-py3-none-any.whl", hash = "sha256:327cbda3da756e2de031a3107b81ab7b3770a602c4d16ca618298c526f4bec1e"},
     {file = "exceptiongroup-1.1.0.tar.gz", hash = "sha256:bcb67d800a4497e1b404c2dd44fca47d3b7a5e5433dbab67f96c1a685cdfdf23"},
@@ -2456,6 +2479,10 @@ numpy = [
     {file = "numpy-1.24.2-pp38-pypy38_pp73-win_amd64.whl", hash = "sha256:150947adbdfeceec4e5926d956a06865c1c690f2fd902efede4ca6fe2e657c3f"},
     {file = "numpy-1.24.2.tar.gz", hash = "sha256:003a9f530e880cb2cd177cba1af7220b9aa42def9c4afc2a2fc3ee6be7eb2b22"},
 ]
 packaging = [
     {file = "packaging-23.0-py3-none-any.whl", hash = "sha256:714ac14496c3e68c99c29b00845f7a2b85f3bb6f1078fd9f72fd20f0570002b2"},
     {file = "packaging-23.0.tar.gz", hash = "sha256:b6ad297f8907de0fa2fe1ccbd26fdaf387f5f47c7275fedf8cce89f99446cf97"},

 optional = false
 python-versions = ">=3.6"
+[[package]]
+name = "et-xmlfile"
+version = "1.1.0"
+description = "An implementation of lxml.xmlfile for the standard library"
+category = "main"
+optional = false
+python-versions = ">=3.6"
 [[package]]
 name = "exceptiongroup"
 version = "1.1.0"
 optional = false
 python-versions = ">=3.8"
+[[package]]
+name = "openpyxl"
+version = "3.1.2"
+description = "A Python library to read/write Excel 2010 xlsx/xlsm files"
+category = "main"
+optional = false
+python-versions = ">=3.6"
+[package.dependencies]
+et-xmlfile = "*"
 [[package]]
 name = "packaging"
 version = "23.0"
 [metadata]
 lock-version = "1.1"
 python-versions = "^3.10"
+content-hash = "9857bd72535987e589103fdfd65fcf409ea02207f0c0d0bfc62531770c009a0f"
 [metadata.files]
 aiofiles = [
     {file = "entrypoints-0.4-py3-none-any.whl", hash = "sha256:f174b5ff827504fd3cd97cc3f8649f3693f51538c7e4bdf3ef002c8429d42f9f"},
     {file = "entrypoints-0.4.tar.gz", hash = "sha256:b706eddaa9218a19ebcd67b56818f05bb27589b1ca9e8d797b74affad4ccacd4"},
 ]
+et-xmlfile = [
+    {file = "et_xmlfile-1.1.0-py3-none-any.whl", hash = "sha256:a2ba85d1d6a74ef63837eed693bcb89c3f752169b0e3e7ae5b16ca5e1b3deada"},
+    {file = "et_xmlfile-1.1.0.tar.gz", hash = "sha256:8eb9e2bc2f8c97e37a2dc85a09ecdcdec9d8a396530a6d5a33b30b9a92da0c5c"},
+]
 exceptiongroup = [
     {file = "exceptiongroup-1.1.0-py3-none-any.whl", hash = "sha256:327cbda3da756e2de031a3107b81ab7b3770a602c4d16ca618298c526f4bec1e"},
     {file = "exceptiongroup-1.1.0.tar.gz", hash = "sha256:bcb67d800a4497e1b404c2dd44fca47d3b7a5e5433dbab67f96c1a685cdfdf23"},
     {file = "numpy-1.24.2-pp38-pypy38_pp73-win_amd64.whl", hash = "sha256:150947adbdfeceec4e5926d956a06865c1c690f2fd902efede4ca6fe2e657c3f"},
     {file = "numpy-1.24.2.tar.gz", hash = "sha256:003a9f530e880cb2cd177cba1af7220b9aa42def9c4afc2a2fc3ee6be7eb2b22"},
 ]
+openpyxl = [
+    {file = "openpyxl-3.1.2-py2.py3-none-any.whl", hash = "sha256:f91456ead12ab3c6c2e9491cf33ba6d08357d802192379bb482f1033ade496f5"},
+    {file = "openpyxl-3.1.2.tar.gz", hash = "sha256:a6f5977418eff3b2d5500d54d9db50c8277a368436f4e4f8ddb1be3422870184"},
+]
 packaging = [
     {file = "packaging-23.0-py3-none-any.whl", hash = "sha256:714ac14496c3e68c99c29b00845f7a2b85f3bb6f1078fd9f72fd20f0570002b2"},
     {file = "packaging-23.0.tar.gz", hash = "sha256:b6ad297f8907de0fa2fe1ccbd26fdaf387f5f47c7275fedf8cce89f99446cf97"},

pyproject.toml CHANGED Viewed

@@ -9,6 +9,7 @@ readme = "README.md"
 python = "^3.10"
 pandas = "^1.5.3"
 streamlit = "^1.17.0"
 [tool.poetry.group.dev.dependencies]
 black = "^23.1.0"

 python = "^3.10"
 pandas = "^1.5.3"
 streamlit = "^1.17.0"
+openpyxl = "^3.1.2"
 [tool.poetry.group.dev.dependencies]
 black = "^23.1.0"

src/maorganizer/datawrangling.py CHANGED Viewed

@@ -7,9 +7,7 @@ import pandas as pd
 DATAFOLDER = Path().cwd() / "data"
-MONTH = "Feb"
-FILENAME = f"participants-Meetup-{MONTH}"
 @dataclass
@@ -17,7 +15,9 @@ class Person:
     name: str
     def __post_init__(self):
-        self.name = ' '.join([namepart for namepart in self.name.strip().title().split(' ') if namepart])
     def __hash__(self):
         return hash(self.name)
@@ -38,27 +38,31 @@ class Person:
     def lastname(self):
         return " ".join(self.name.split(" ")[1:])
 @dataclass
 class Attendancelist:
     participants: Set[Person]
     def load_from_file(
-        filename: pathlib.PosixPath, cname: str = "Name", sep: str = None
     ):
-        if sep:
-            df = pd.read_csv(filename, sep=sep)
-        elif filename.suffix in [".xlsx", ".xls"]:
             df = pd.read_excel(filename)
         elif filename.suffix == ".csv":
-            df = pd.read_csv(filename)
         else:
             raise ValueError(
                 "Unsupported filetype, please specify a separator or choose one "
                 "of the following filetypes: .xlsx, .xls, .csv"
             )
-        return Attendancelist({Person(name) for name in df[cname]})
     @property
     def n_attendees(self):
@@ -82,15 +86,21 @@ class Attendancelist:
             raise ValueError(
                 "Unsupported filetype, please choose one of the following: .xlsx, .csv"
             )
     def to_file(self) -> str:
-        return self.to_df().to_csv(index=False).encode('utf-8')
     def update(self, other: "Attendancelist"):
         return Attendancelist(other.participants - self.participants)
-    def find(self, somebody: Person):
         return {p for p in self.participants if p.is_similar(somebody)}
-    def find_multiple(self, people: List[Person]):
-        return {p: self.find(p) for p in people}

 DATAFOLDER = Path().cwd() / "data"
+NAMECOLUMN = "Name"
 @dataclass
     name: str
     def __post_init__(self):
+        self.name = " ".join(
+            [namepart for namepart in self.name.strip().title().split(" ") if namepart]
+        )
     def __hash__(self):
         return hash(self.name)
     def lastname(self):
         return " ".join(self.name.split(" ")[1:])
+    def name_contains(self, text) -> bool:
+        return text in self.name.lower()
 @dataclass
 class Attendancelist:
     participants: Set[Person]
+    def load_from_df(df, cname: str = NAMECOLUMN):
+        return Attendancelist({Person(name) for name in df[cname]})
     def load_from_file(
+        filename: pathlib.PosixPath, cname: str = NAMECOLUMN, sep: str = None
     ):
+        if filename.suffix in [".xlsx", ".xls"]:
             df = pd.read_excel(filename)
         elif filename.suffix == ".csv":
+            df = pd.read_csv(filename, sep=sep)
         else:
             raise ValueError(
                 "Unsupported filetype, please specify a separator or choose one "
                 "of the following filetypes: .xlsx, .xls, .csv"
             )
+        return Attendancelist.load_from_df(df, cname)
     @property
     def n_attendees(self):
             raise ValueError(
                 "Unsupported filetype, please choose one of the following: .xlsx, .csv"
             )
     def to_file(self) -> str:
+        return self.to_df().to_csv(index=False).encode("utf-8")
     def update(self, other: "Attendancelist"):
         return Attendancelist(other.participants - self.participants)
+    def find_person(self, somebody: Person):
         return {p for p in self.participants if p.is_similar(somebody)}
+    def find_people(self, people: List[Person]):
+        return {p: self.find_person(p) for p in people}
+    def find_word(self, word: str):
+        return {p for p in self.participants if p.name_contains(word.lower())}
+    def find_words(self, words: List[str]):
+        return {word: self.find_word(word) for word in words}

src/maorganizer/ui.py ADDED Viewed

	@@ -0,0 +1,140 @@

+import io
+from enum import Enum
+from pathlib import Path
+from typing import Dict, Tuple
+import pandas as pd
+import streamlit as st
+from maorganizer.datawrangling import NAMECOLUMN, Attendancelist
+CSV_EXTENSIONS = [".csv", ".txt"]
+EXCEL_EXTENSIONS = [".xls", ".xlsx"]
+ACCEPTED_EXTENSIONS = CSV_EXTENSIONS + EXCEL_EXTENSIONS
+SEPARATORTYPES = {"TAB": "\t", "COMMA": ","}
+class TASKS(str, Enum):
+    SPLIT = "✂️ ... split attendees into first and last name and download results"
+    COMPARE = " 👀 ... compare two meetings with each other and find updates"
+    FIND = " 🔎 ... find specific attendees"
+    def __str__(self) -> str:  # makes enum values duck-type to strings
+        return str.__str__(self)
+def load_df_from_uploaded_data(filename, data, sep=None) -> pd.DataFrame:
+    if Path(filename).suffix in EXCEL_EXTENSIONS:
+        df = pd.read_excel(data)
+    elif Path(filename).suffix in CSV_EXTENSIONS:
+        df = pd.read_csv(filename, sep=sep)
+    else:
+        raise ValueError(
+            f"Please choose one of the following extensions: {', '.join(ACCEPTED_EXTENSIONS)}"
+        )
+    return df
+def make_attendance_data_from_file_uploads(
+    uploaded_files, sep=None, cname=NAMECOLUMN
+) -> Dict:
+    return {
+        file.name: Attendancelist.load_from_df(
+            load_df_from_uploaded_data(file.name, file, sep), cname=cname
+        )
+        for file in uploaded_files
+    }
+def load_data(uploaded_files) -> Tuple[Dict, bool]:
+    try:
+        data = make_attendance_data_from_file_uploads(
+            uploaded_files, sep=None, cname=NAMECOLUMN
+        )
+    except KeyError:
+        contains_csvs = sum(
+            [Path(file.name).suffix in CSV_EXTENSIONS for file in uploaded_files]
+        )
+        if contains_csvs:
+            separator = st.radio(
+                "We detected text files in your input. What is their separator?",
+                sorted(SEPARATORTYPES.keys()),
+            )
+        namecolumn = st.text_input(
+            "Column header of your file's name column", NAMECOLUMN
+        )
+        try:
+            data = make_attendance_data_from_file_uploads(
+                uploaded_files, sep=SEPARATORTYPES[separator], cname=namecolumn
+            )
+        except KeyError:
+            st.error(
+                f"We could not find a column {namecolumn} in your data. Please use the options above to specify your column separator and the column name of your name column."
+            )
+            data = {}
+    if data:
+        st.success(
+            "Successfully loaded the following files:\\\n\\\n"
+            + "\\\n".join([f"{k} - {v.n_attendees} attendees" for k, v in data.items()])
+        )
+    return data
+def render_file_selector(meetings, key):
+    show_processed_list = st.checkbox("Display the processed list of attendees")
+    if show_processed_list:
+        filename = st.selectbox(
+            "Select the file to display", options=list(meetings.keys()), key=key
+        )
+        attendees = meetings[filename]
+        st.write(attendees.to_df())
+def create_file_uploader():
+    uploaded_files = st.file_uploader(
+        label="📄 Upload your files", accept_multiple_files=True
+    )
+    if uploaded_files:
+        meetings = load_data(uploaded_files)
+        render_file_selector(meetings, "file_upload")
+        return meetings
+    else:
+        return {}
+def create_task_selector():
+    st.header("📝 Step 2: Choose a Task")
+    task = st.radio("I would like to ...", [task.value for task in TASKS])
+    if task == TASKS.SPLIT.value:
+        st.markdown("❔ **Description:** Split a list of names into first and surname.")
+    elif task == TASKS.COMPARE.value:
+        st.markdown(
+            "❔ **Description:** Compare two attendee lists with each and find attendees who have recently joined."
+        )
+    elif task == TASKS.FIND.value:
+        st.markdown(
+            "❔ **Description:** Find attendees in a list by either first name or surname or by substrings."
+        )
+    return task
+def render_xlsx_download_button(data, filename, key) -> None:
+    with io.BytesIO() as output:
+        with pd.ExcelWriter(output, engine="openpyxl") as writer:
+            for sheetname, attendees in data.items():
+                attendees.to_df().to_excel(writer, sheet_name=sheetname, index=False)
+            writer.save()
+        st.download_button(
+            label="💾 Download Results",
+            data=output.getvalue(),
+            file_name=filename,
+            mime="application/vnd.ms-excel",
+            key=key,
+        )

tests/test_attendancelist.py CHANGED Viewed

@@ -2,21 +2,30 @@ from maorganizer.datawrangling import Attendancelist, Person
 def test_attendancelist_finds_person_by_substring():
-    assert Attendancelist({Person("zaphod beeblebrox"), Person("ford prefix")}).find(
-        Person("zaphod")
-    ) == {Person("Zaphod Beeblebrox")}
 def test_attendancelists_finds_multiple_people_if_existent():
     assert Attendancelist(
         {Person("zaphod beeblebrox"), Person("zaphod prefix"), Person("ford prefix")}
-    ).find(Person("zaphod")) == {Person("Zaphod Beeblebrox"), Person("Zaphod Prefix")}
-def test_find_multiple_finds_alls():
     assert Attendancelist(
         {Person("zaphod beeblebrox"), Person("ford prefix"), Person("Marvin")}
-    ).find_multiple({Person("zaphod"), Person("ford prefix")}) == {
         Person(name="Ford Prefix"): {Person(name="Ford Prefix")},
         Person(name="Zaphod"): {Person(name="Zaphod Beeblebrox")},
     }

 def test_attendancelist_finds_person_by_substring():
+    assert Attendancelist(
+        {Person("zaphod beeblebrox"), Person("ford prefix")}
+    ).find_word("aph") == {Person("Zaphod Beeblebrox")}
+def test_attendancelist_finds_person_by_namepart():
+    assert Attendancelist(
+        {Person("zaphod beeblebrox"), Person("ford prefix")}
+    ).find_person(Person("zaphod")) == {Person("Zaphod Beeblebrox")}
 def test_attendancelists_finds_multiple_people_if_existent():
     assert Attendancelist(
         {Person("zaphod beeblebrox"), Person("zaphod prefix"), Person("ford prefix")}
+    ).find_person(Person("zaphod")) == {
+        Person("Zaphod Beeblebrox"),
+        Person("Zaphod Prefix"),
+    }
+def test_find_people_finds_alls():
     assert Attendancelist(
         {Person("zaphod beeblebrox"), Person("ford prefix"), Person("Marvin")}
+    ).find_people({Person("zaphod"), Person("ford prefix")}) == {
         Person(name="Ford Prefix"): {Person(name="Ford Prefix")},
         Person(name="Zaphod"): {Person(name="Zaphod Beeblebrox")},
     }

tests/test_datawrangling.py CHANGED Viewed

@@ -40,4 +40,4 @@ def test_whitespace_gets_deleted_from_edges_of_name():
 def test_multiple_whitespace_gets_correctly_deleted_from_inside_a_name():
-    assert Person("Zaphod  Beeblebrox") == Person("Zaphod Beeblebrox")


40
41
42	def test_multiple_whitespace_gets_correctly_deleted_from_inside_a_name():
43	+ assert Person("Zaphod Beeblebrox") == Person("Zaphod Beeblebrox")