Intelcruit / examples /sample_transcription.txt
Nam Fam
add examples/
9cb879a
Dưới đây là **mock transcript** gồm **10 cặp câu hỏi – trả lời** cho một buổi phỏng vấn vị trí **AI Engineer** tại VNPT, phù hợp với JD bạn cung cấp:
---
### 🎙️ **Transcript – Interview for AI Engineer**
**📌 Speaker tags:**
* `I:` Interviewer
* `C:` Candidate
---
**1.**
**I:** Bạn có thể giới thiệu ngắn gọn về kinh nghiệm làm việc với các bài toán xử lý ngôn ngữ tự nhiên không?
**C:** Dạ, em có khoảng 2 năm làm NLP tại một startup về EdTech. Em từng phát triển chatbot hỗ trợ học sinh luyện tập, dùng mô hình seq2seq kết hợp với BERT để hiểu ngữ cảnh. Ngoài ra em cũng từng triển khai một pipeline trích xuất thực thể cho hệ thống văn bản hợp đồng.
---
**2.**
**I:** Bạn đã từng triển khai model nào liên quan đến speech-to-text chưa?
**C:** Có ạ. Trong một dự án nội bộ, em dùng Wav2Vec 2.0 fine-tune cho dữ liệu tiếng Việt để nhận diện giọng nói nhân viên. Sau đó đóng gói model này thành REST API bằng FastAPI để tích hợp vào hệ thống chăm sóc khách hàng.
---
**3.**
**I:** Khi làm việc với tiếng Việt, bạn gặp khó khăn gì về preprocessing?
**C:** Em thấy khó nhất là tokenization, vì tiếng Việt không có khoảng trắng rõ ràng giữa các từ ghép. Em thường dùng underthesea để tách từ, sau đó custom lại thêm bằng regex vì dữ liệu ngành giáo dục có nhiều từ viết tắt riêng.
---
**4.**
**I:** Bạn từng dùng thư viện nào để xây dựng model NLP?
**C:** Em chủ yếu dùng HuggingFace Transformers, kết hợp với PyTorch để huấn luyện. Ngoài ra, em cũng dùng scikit-learn cho các task đơn giản như phân loại sắc thái hoặc vector hóa dữ liệu đầu vào bằng TF-IDF.
---
**5.**
**I:** Với những model bạn đã huấn luyện, bạn đóng gói và triển khai chúng như thế nào?
**C:** Em sử dụng Docker để đóng gói toàn bộ môi trường, bao gồm cả mô hình và script phục vụ inference. Sau đó triển khai trên EC2 hoặc dùng Docker Compose nếu chạy trên server nội bộ. Em cũng có kinh nghiệm monitoring bằng Prometheus và Grafana.
---
**6.**
**I:** VNPT có nhiều use case liên quan đến y tế, bạn nghĩ ứng dụng AI có thể giúp gì trong ngành này?
**C:** Dạ, AI có thể hỗ trợ đọc hồ sơ bệnh án bằng NLP, trích xuất thông tin y tế quan trọng. Ngoài ra, voice-to-text cũng rất hữu ích khi bác sĩ ghi chú bằng giọng nói. Em nghĩ việc kết hợp cả hai kỹ thuật này để phân tích nội dung bác sĩ nói sẽ rất thiết thực.
---
**7.**
**I:** Bạn có thể chia sẻ một bài toán AI bạn thấy “tác động xã hội lớn”?
**C:** Em từng làm một đề tài về nhận diện cảm xúc học sinh qua giọng nói, giúp giáo viên hiểu được học sinh đang lo lắng hay chán nản. Em thấy rất phù hợp với ngành giáo dục vì nó giúp điều chỉnh phương pháp dạy phù hợp hơn.
---
**8.**
**I:** Bạn có từng làm việc trong nhóm phát triển đa vai trò chưa?
**C:** Có ạ. Trong dự án chatbot, em là người thiết kế NLP pipeline, còn bạn khác đảm nhận frontend. Chúng em dùng Jira để quản lý sprint và thường xuyên sync qua Slack, mỗi tuần có review kết quả với PO.
---
**9.**
**I:** Theo bạn, một AI Engineer giỏi thì cần những phẩm chất gì?
**C:** Theo em là phải giỏi cả lý thuyết và thực hành. Không chỉ biết mô hình nào tốt, mà còn phải hiểu cách triển khai, tối ưu hóa chi phí, phục vụ đúng use case. Và đặc biệt là phải biết học nhanh, vì công nghệ thay đổi rất nhanh.
---
**10.**
**I:** Bạn có theo dõi các nghiên cứu hoặc competition AI không?
**C:** Có ạ. Em thường theo dõi NeurIPS, ACL. Năm ngoái em tham gia cuộc thi Zalo AI Challenge, tụi em đạt top 20 ở bài toán Vietnamese QA. Em cũng thường đọc blog của HuggingFace để cập nhật công nghệ mới.
---
Bạn muốn mình trích ra từng đoạn trả lời để mapping thử vào rubric tiêu chí (ví dụ: `NLP`, `production skill`, `teamwork`, `impact awareness`, etc.) không?