1. 대사찾기 사이트 데이터를 10개월 만에 업데이트했습니다. (이제 25년 5월 5일까지 검색 가능)
2. 10개월치 데이터로 새로운 퀴즈와 워드 클라우드를 만들었습니다.
새로운 퀴즈는 무한히 문제가 나오고 틀릴 때까지 진행됩니다.
이번 워드 클라우드는 품사와 단어길이를 직접 조절해서 볼 수 있습니다.
https://chimlang.pythonanywhere.com/static/indexquiz.html
모바일은 약간 버벅일 수 있음.

3. 사실 이번 퀴즈 페이지는 AI가 99% 코드를 짰습니다. (이거 사용해 보려고 만들었음.)
구글의 Firebase Studio (+ Gemini 2.5 pro)를 사용했습니다.
2년 전: AI가 문단 하나를 자동 완성
1년 전: AI가 문서 하나를 자동 완성
요즘: AI가 프로젝트 전체를 자동 완성
혼자 파일 만들고 코드 쓰고 수정하고 실행 오류 나면 다시 알아서 수정하고. Claude 기반은 심지어 눈도 달려서 브라우저 켜서 작동해 보고 다시 잘못된 거 수정도 합니다.
개발자분들이면 Agent니 MCP니 이미 쓰고 계시겠지만,
모르시는 분들은 간단히 Firebase Studio에서 한 번 시도해 보세요. (다만 반드시 Gemini 2.5 pro를 선택해야 합니다. 얘가 현재 코딩 최강자.)
무료입니다. (근데, 에러가 엄청 뜸. 구글이니까 곧 해결하겠쥬?)
4. Zipf의 법칙을 아시나요?

(단어의 빈도 수) 는 (단어의 빈도 수 순위) 에 반비례 한다는 경험칙입니다.
10번째로 많이 쓰는 단어는 100번째로 많이 쓰는 단어보다 더 많이 쓰는 거죠?
그런데 그게 딱 10 배 더 많이 쓴다는 뜻입니다.
위 그래프는 침착맨 대사찾기에서 나온 명사들로 그려본 것인데요, 역시나 법칙에 잘 맞습니다.
(근데, 신기한 거 발견했는데, 품사 중에 부사, 조사, 감탄사, 문장부호만 따로 해보면 법칙에 안맞음. 1/(순위)와 1/(순위)^3 사이임.)
아무튼 이 법칙을 바탕으로 대략적으로 생각해 보면, “(단어의 빈도 수) * (순위) = 일정”이기때문에,
수 만가지 단어를 아는 사람을 원어민이라고 했을 때,
수 천가지 단어를 아는 것만으로 80%의 단어 사용은 커버되고,
수 백가지 단어를 아는 것만으로 60%의 단어 사용은 커버되고,
수 십가지 단어를 아는 것만으로 40%의 단어 사용이 커버되고,
수 개의 단어를 아는 것만으로 20%의 단어 사용이 커버됩니다.
그래서 외국어 배울 때 필수 단어 수백개만 외워도 반절 이상은 아는 단어들이 됩니다.
(하지만, 그렇다고 문장의 뜻이 반절 이상 이해 되는 건 아니라는게 함정)