Skip to content

CausalInferenceLab/Lang2SQL

 
 

Repository files navigation

Lang2SQL

PseudoLab Discord Community Stars Badge Forks Badge Pull Requests Badge Issues Badge GitHub contributors

"우리는 함께 코드와 아이디어를 나누며 더 나은 데이터 환경을 만들기 위한 오픈소스 여정을 떠납니다. 🌍💡"

프로젝트 개요 (Project Overview)

🚀 신입이 SQL을 두려워하지 않도록

🤔 처음 데이터팀에 합류하면 가장 먼저 마주하는 고민들:

  • 🤯 "테이블이 너무 많아! 뭐부터 봐야 하지?"
  • 🧐 "조인은 이렇게 걸어도 되나?"
  • 🐌 "이 SQL, 성능 괜찮을까?"
  • 😰 "어떻게 쿼리해야 인사이트를 얻을 수 있을까?"

💡 Lang2SQL로 해결해 봅시다.

  • ✅ 자연어 입력 → 적절한 테이블 추천
  • ✅ 올바른 컬럼 조합으로 SQL 자동 생성
  • ✅ Best Practice 기반 자동 성능 최적화

🚀 우리는 SQL을 더 쉽게, 더 빠르게, 더 효율적으로 만들 것입니다.

🌍 그리고, 우리는 오픈소스라는 무한한 가능성의 바다로 항해합니다.

🌟 프로젝트 목표 (Project Vision)

"박치기공룡들의 배포부터 시작하는 프로젝트"

lang2sql 패키지 1.0.0 달성하기

  • 더 이상 실험적인(beta, alpha) 상태가 아니며, 정식 릴리스(Stable Release)임을 뜻합니다.

LangGraph 기반 쿼리 생성: 단순한 SQL 생성이 아닌, 최적화된 SQL 제공을 목표로 합니다.

  • 자연어(NL) 입력을 기반으로 의미론적으로 최적화된 SQL 생성
  • 사내 Best Practice SQL을 통한 성능 향상

오픈소스 협업: 더 많은 사람들이 참여할 수 있도록, 코드와 아이디어를 GitHub으로 공유합니다.

  • 이 오픈소스 프로젝트는 전세계 개발자들과 함께 협업하는것을 목표로 합니다.

🧑 역동적인 팀 소개 (Dynamic Team)

역할 이름 기술 스택 배지 주요 관심 분야
Project Manager 이동욱 Python LLM 오픈소스 인과추론

🚀 프로젝트 로드맵 (Project Roadmap)

gantt
    title 2025 프로젝트 여정
    
    section 프로젝트 준비
    OT - 프로젝트 이해도 Sync-Up / Issue 하나 생성하기  :a1, 2025-03-03, 7d

    section Table Retrieval 최적화
    Table Retrieval 최적화 (1)  :a2, 2025-03-10, 7d
    Table Retrieval 최적화 (2)  :a3, 2025-03-17, 7d
    
    section 휴식 및 리프레시
    Magical Week 휴식 (1)       :break1, 2025-03-24, 7d

    section SQL Generation
    SQL Generation (1)         :a4, 2025-03-31, 7d
    SQL Generation (2)         :a5, 2025-04-07, 7d

    section SQL Optimization
    SQL Optimization           :a6, 2025-04-14, 7d

    section 중간 점검 및 조정
    중간점검                   :a7, 2025-04-21, 7d

    section 휴식 및 리프레시
    Magical Week 휴식 (2)       :break2, 2025-04-28, 7d

    section Dockerization
    Dockerize (1)              :a8, 2025-05-05, 7d
    Dockerize (2)              :a9, 2025-05-12, 7d

    section 오픈소스화
    오픈소스화 작업 (1)        :a10, 2025-05-19, 7d
    오픈소스화 작업 (2)        :a11, 2025-05-26, 7d
Loading

🛠️ 우리의 개발 문화 (Our Development Culture)

우리의 개발 문화

class CollaborationFramework:
    def __init__(self):
        self.tools = {
            'communication': 'Discord',
            'version_control': 'GitHub Projects',
            'ci/cd': 'GitHub Actions',
            'docs': 'Github Wiki'
        }
    
    def workflow(self):
        return """주간 사이클:
        1️⃣ 월요일: 코드 리뷰 세션 & 주간목표 설정 (Live Share)
        3️⃣ 금요일: 진행상황 체크 (logging)

📈 성과 지표 (Achievement Metrics)

2025 주요 KPI

지표 목표치 현재 달성률
커밋 수 100 0%
배포 버전 1.0.0 달성 1.0.0 16%

💻 주차별 활동 (Activity History)

날짜 내용 발표자
2025/03/03 OT - 프로젝트 이해도 Sync-Up / Issue 하나 생성하기 이동욱
2025/03/10 🔍 Table Retrieval 최적화 🔍 미정
2025/03/17 🔍 Table Retrieval 최적화 🔍 미정
2025/03/24 ✨ Magical Week 휴식 ✨ 미정
2025/03/29 ✨ 인과추론팀 행사 참여 ✨ 미정
2025/03/31 ✏️ SQL Generation ✏️ 미정
2025/04/07 ✏️ SQL Generation ✏️ 미정
2025/04/14 ⚡ SQL Optimization ⚡ 미정
2025/04/21 ✨ 중간점검 ✨ 미정
2025/04/28 ✨ Magical Week 휴식 ✨ 미정
2025/05/05 🛠️ Dockerize 🛠️ 미정
2025/05/12 🛠️ Dockerize 🛠️ 미정
2025/05/19 📖 오픈소스화 작업 📖 미정
2025/05/26 📖 오픈소스화 작업 📖 미정

"본 계획표는 예시이며, 프로젝트의 방향성을 유지하면서 자유롭게 기여하는 것을 목표로 합니다."

💡 학습 자원 (Learning Resources)

🌱 참여 안내 (How to Engage)

🎯 우리가 함께 얻어갈 점 (What We’ll Gain)

"이 스터디에 참여하면서, 여러분이 얻어갈 수 있는 것은 단순한 코드 경험 그 이상입니다."

  • 🔥 오픈소스 기여 경험 – GitHub에서 이슈 관리, PR 작성, 리뷰 등 협업을 경험합니다.
  • 🔥 배포 경험 (PyPI & 오픈소스 배포) – lang2sql 패키지를 개발하며 직접 PyPI 패키지를 배포하는 경험을 가질 수 있습니다.
  • 🔥 실무 적용 – 본 프로젝트는 완성도를 높여 실무 환경에 적용 예정입니다. ${\textsf{\color{YellowOrange}사이드 프로젝트로 머물지 않습니다.}}$

🔍 원하는 팀원 (Who We're Looking For)

"함께 성장하고, 오픈소스 문화를 즐길 수 있는 팀원을 찾고 있습니다!"

  • ✅ 3개월 동안 꾸준히 참여할 수 있는 의지를 가지신 분
  • ✅ 오픈소스 협업에 관심이 있으신분
  • ✅ 최소 주 1회 의미있는 프로젝트 기여 가능하신분 (Issue 생성, 코드기여, 문서화 등등)

🤗 비고

팀원으로 참여하시려면 러너 모집 기간에 신청해주세요.

  • 링크 (준비중)

누구나 청강을 통해 모임을 참여하실 수 있습니다.

  1. 특별한 신청 없이 정기 모임 시간에 맞추어 디스코드 #Room-AN 채널로 입장
  2. Magical Week 중 행사에 참가
  3. Pseudo Lab 행사에서 만나기

Acknowledgement 🙏

Lang2SQL is developed as part of Pseudo-Lab's Open Research Initiative. Special thanks to our contributors and the open source community for their valuable insights and contributions.

About Pseudo Lab 👋🏼

Pseudo-Lab is a non-profit organization focused on advancing machine learning and AI technologies. Our core values of Sharing, Motivation, and Collaborative Joy drive us to create impactful open-source projects. With over 5k+ researchers, we are committed to advancing machine learning and AI technologies.

Contributors 😃



License 🗞

This project is licensed under the MIT License.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages