데이터 중심 애플리케이션 설계(DDIA) 6쇄 개인적인 번역 정오표

- 최근 업데이트 : 2026-06-05

* 2026-06-02 부터 지속적으로 업데이트중 입니다. 2026-06-02 기준 3장 읽는중이며, 읽는 속도가 빠르지 않습니다. 책을 모두 읽고 개인 번역 정오표가 어느 정도 정리되면 이 안내 문구는 삭제할 예정입니다.

데이터 중심 애플리케이션 설계(이하 DDIA) 초반부를 읽고 있습니다. 내용 자체는 좋은 책이라고 느끼고 있습니다.

다만 읽는 중 일부 번역에서 원문의 뉘앙스가 약해지거나, 문맥상 의미가 어색하게 읽히는 부분이 있어 개인적으로 정리해두려 합니다.

이 글은 공식 정오표가 아니라, DDIA 한국어판 6쇄를 읽으며 개인적으로 발견한 번역상 아쉬운 부분을 원서와 대조해 정리한 글입니다. 이후 읽으면서 추가 발견되는 내용이 있으면 계속 갱신할 예정입니다. 특히 문맥상 어색하게 읽히는 표현이 아니라, 내용 이해 자체에 문제가 될 수 있는 번역은 ‘(내용 오류)’로 별도 표기했으며, 해당 항목은 출판사 정오표로도 제보해두었습니다.

1. 17p 아래에서 11번째 줄 (내용 오류)

번역서 : 하지만 단일 노드에 상태 유지(stateful) 데이터 시스템을 분산 설치하는 일은 아주 많은 복잡도가 추가적으로 발생한다.
원문 : taking stateful data systems from a single node to a distributed setup …

이 문장은 from a single node to a distributed setup 구조이므로, “단일 노드에” 상태 유지 데이터 시스템을 분산 설치한다는 의미가 아니라, “단일 노드의 상태 유지 데이터 시스템을” 분산 구성으로 옮기는 의미에 가깝습니다.

해당 내용은 뉘앙스 차이라기 보단 오류에 가깝다고 생각하여 정오표 추가 요청드렸고, 현재 정오표에 반영된 것으로 보입니다.

다만 정오표에는 5쇄 항목으로 들어가 있어 6쇄 구매자가 확인하기에는 다소 혼동될 수 있어 보입니다. 실제론 6쇄 정오표에 들어가야 하는 내용입니다.

2. 20p 아래에서 10번째줄

번역서 : 성능 문제 해결을 목표로 한 해킹
원문 : hacks aimed at solving performance problems

여기서 hacks는 보안 침해나 공격 의미의 “해킹”이라기보다는, 성능 문제를 해결하기 위해 넣은 꼼수성 구현 또는 임시 우회책에 가깝다고 보입니다. "성능 문제를 해결하려고 넣은 임시방편" 정도가 자연스러울 것 같습니다. 한국어로 '해킹'이 일반적으로 보안 침해나 공격 쪽으로 먼저 읽히지 않나 생각됩니다.

3. 75p 아래에서 7번째줄

번역서 : 이런 유형의 작업 부하에서는 쓰기가 아주 많지만 고유 키는 많지 않다. 즉, 키 당 쓰기 수가 많지만 메모리에 모든 키를 보관할 수 있다.
원문 : In this kind of workload, there are a lot of writes, but there are not too many distinct keys—you have a large number of writes per key, but it’s feasible to keep all keys in memory.

원문 뉘앙스가 좀 사라진 느낌입니다. 원문은 "고유 키 수가 너무 많지는 않아서, 모든 키를 메모리에 보관하는 것이 현실적으로 가능하다"는 조건부 뉘앙스가 있습니다. 반면 번역문은 단정적으로 읽힙니다.

전체적으로 이정도가 자연스러워 보입니다. "이런 유형의 작업 부하에서는 쓰기 수는 많지만, 서로 다른 키의 수는 메모리에 올릴 수 없을 만큼 많지는 않다. 즉, 키마다 많은 쓰기가 발생하지만 전체 키 집합은 메모리에 보관할 수 있는 수준이다."

4. 77p '파일 형식' 내용

번역서 : 바이트 단위의 문자열 길이를 부호화한 다음 원시 문자열(이스케이핑할 필요 없이)을 부호화하는 바이너리 형식을 사용하는 편이 더 빠르고 간단하다.
원문 : It’s faster and simpler to use a binary format that first encodes the length of a string in bytes, followed by the raw string (without need for escaping)

번역문에서는 “부호화”가 두 번 나오면서, 문자열 길이와 원시 문자열을 각각 별도로 부호화한다는 느낌이 강하게 듭니다. 원문의 핵심은 길이를 먼저 기록하고, 그 뒤에 원본 문자열 바이트를 그대로 둔다는 것입니다. 이정도가 자연스러워 보입니다. "문자열의 바이트 길이를 먼저 기록하고, 이어서 문자열 원본을 그대로 저장하는 바이너리 형식을 사용하는 편이 더 빠르고 단순하다. 이 방식에서는 이스케이프 처리가 필요 없다."

5. 93p 2번째줄

번역서 : 초창기 비즈니스 데이터 처리는 데이터베이스 쓰기가 보통 판매, 공급 업체에 발주, 직원 급여 지불 등과 같은 커머셜 트랜잭션(상거래)에 해당했다.
원문 : In the early days of business data processing, a write to the database typically corre sponded to a commercial transaction taking place: making a sale, placing an order with a supplier, paying an employee’s salary, etc.

'a write to the database'를 '데이터베이스 쓰기' 라고 옮긴 부분이 한국어 문장으로는 다소 어색하게 읽힙니다. "초창기 비즈니스 데이터 처리 시스템은 주로 판매, 공급업체 발주, 급여 지급처럼 실제로 발생한 상업적 거래를 데이터베이스에 기록하는 데 사용됐다" 정도가 자연스러워 보입니다.

6. 94p '데이터 웨어하우싱' 내용 첫번째줄 (내용 오류)

번역서 : 예를 들면 고객 대면 웹 사이트 강화, ...
원문 : systems powering the customer-facing website

원문에서 customer-facing website는 고객이 직접 사용하는 웹사이트에 가깝고, powering은 해당 웹사이트를 “강화”한다기보다 “구동하는/뒷받침하는” 의미로 보입니다. 현재 번역인 “고객 대변 웹 사이트 강화”는 customer-facing과 powering의 의미가 모두 어색하게 옮겨진 것으로 보이며, 트랜잭션 처리 시스템의 예시를 나열하는 문맥에도 맞지 않습니다. 예를 들어 “고객용 웹사이트의 기능을 뒷받침하는 시스템들” 정도가 더 자연스러워 보입니다.

정오표 제보 완료

7. 104p 아래에서 3번째줄

번역서 : ... 가상 뷰(virtual view)는 단지 질의를 작성하는 단축키일 뿐이다.
원문 : ... whereas a virtual view is just a shortcut for writing queries.

여기서 'shortcut'은 키보드 단축키 같은 의미라기보다, 긴 질의를 매번 직접 작성하지 않도록 미리 정의한 질의에 이름을 붙여 재사용하게 해주는 축약 표현에 가깝습니다 (C에서 #define 느낌). 가상 뷰는 질의 결과를 디스크에 저장하지 않고, 조회 시점에 미리 정의된 질의로 치환되어 실행되는 구조입니다. 반면 구체화 뷰는 질의 결과를 실제로 계산해 디스크에 저장해둔 복사본입니다.

ex)

가상뷰
CREATE VIEW active_users AS
SELECT id, name, email
FROM users
WHERE status = 'ACTIVE';

실제 사용할 SQL
SELECT *
FROM active_users;

내부적으로 이런식으로 치환되어 실행되는 느낌이라고 보면 됨
SELECT *
FROM (
  SELECT id, name, email
  FROM users
  WHERE status = 'ACTIVE'
) active_users;

따라서 다음 정도가 더 자연스러워 보입니다. "... 가상 뷰는 미리 정의한 질의에 이름을 붙여 재사용하게 해주는 편의 기능일 뿐이라는 점이다."

8. 117p '이진 부호화' 내용 첫번째줄

번역서 : 조직내에서만 사용하는 데이터라면 최소공통분모 부호화 형식(lowest-common-denominator encoding format)을 사용해야 하는 부담감이 덜하다.
원문 : For data that is used only internally within your organization, there is less pressure to use a lowest-common-denominator encoding format.

번역이 맞긴한데, lowest-common-denominator가 영어권의 관용 표현으로, '여러 대상이 모두 받아들일 수 있는 가장 낮은 공통 기준' 느낌 입니다. 반면 한국에서는 '최소공통분모'가 관용적 표현보다는 수학 용어 느낌이 강하므로, 다음 정도가 자연스러워 보입니다. "조직 내부에서만 사용하는 데이터라면, 굳이 가장 폭넓은 호환성을 우선한 범용 부호화 형식을 사용할 필요는 적다."

... 책 읽으면서 계속 추가중 (읽는 속도 느림)

저작자표시 비영리 (새창열림)

'Study > 책, 강의 생각 정리' 카테고리의 다른 글

질문은 LLM이, 답은 내가 - LLM을 활용한 사고확장 자기계발 방법 추천 (Prompted by AI, Answered by Me) (9)	2025.07.22
'객체지향 시스템 디자인 원칙'을 읽으며 정리한 내 생각 - LLM과의 Q&A 기반 사고 확장 (10)	2025.07.16
LLM과 개발 책을 읽으며 든 내 생각 - 개발자식 하브루타 독서 (2)	2025.07.04
'주니어 백엔드 개발자가 반드시 알아야 할 실무 지식'을 읽고 떠오른 내 생각들 (6)	2025.05.19

데이터 중심 애플리케이션 설계(DDIA) 6쇄 개인적인 번역 정오표

1. 17p 아래에서 11번째 줄 (내용 오류)

2. 20p 아래에서 10번째줄

3. 75p 아래에서 7번째줄

4. 77p '파일 형식' 내용

5. 93p 2번째줄

6. 94p '데이터 웨어하우싱' 내용 첫번째줄 (내용 오류)

7. 104p 아래에서 3번째줄

8. 117p '이진 부호화' 내용 첫번째줄

'Study > 책, 강의 생각 정리' 카테고리의 다른 글

댓글

티스토리툴바

데이터 중심 애플리케이션 설계(DDIA) 6쇄 개인적인 번역 정오표

1. 17p 아래에서 11번째 줄 (내용 오류)

2. 20p 아래에서 10번째줄

3. 75p 아래에서 7번째줄

4. 77p '파일 형식' 내용

5. 93p 2번째줄

6. 94p '데이터 웨어하우싱' 내용 첫번째줄 (내용 오류)

7. 104p 아래에서 3번째줄

8. 117p '이진 부호화' 내용 첫번째줄

'Study > 책, 강의 생각 정리' 카테고리의 다른 글

관련글

댓글

티스토리툴바