[SAINT_Lab.]Accelerated federated split learning.pdf

<aside> ๐Ÿ“ข ACCELERATING FEDERATED SPLIT LEARNING VIA LOCAL-LOSS-BASED TRAINING

</aside>

ABSTRACT

์—ฐํ•ฉ ํ•™์Šต(FL)์€ ์„œ๋ฒ„์™€ ํด๋ผ์ด์–ธํŠธ ๊ฐ„์˜ ๋ชจ๋ธ ๊ตํ™˜์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์ž‘๋™ํ•˜๋ฉฐ, ์ƒ๋‹นํ•œ ํ†ต์‹  ๋ฐ ํด๋ผ์ด์–ธํŠธ ์ธก ๊ณ„์‚ฐ ๋ถ€๋‹ด์ด ๋”ฐ๋ฆ…๋‹ˆ๋‹ค.

์ƒˆ๋กœ์šด ๋ถ„ํ•  ํ•™์Šต(SL) ์†”๋ฃจ์…˜์€ ๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜๋ฅผ ์„œ๋ฒ„์™€ ํด๋ผ์ด์–ธํŠธ ๊ฐ„์— ๋ถ„ํ• ํ•จ์œผ๋กœ์จ ํด๋ผ์ด์–ธํŠธ ์ธก ๊ณ„์‚ฐ ๋ถ€๋‹ด์„ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋Ÿฌ๋‚˜ SL ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด๋Š” ๊ฐ ์ฐธ์—ฌ ํด๋ผ์ด์–ธํŠธ๊ฐ€ ์ž์‹ ์˜ ๋ชจ๋ธ์„ ์—…๋ฐ์ดํŠธํ•˜๊ธฐ ์œ„ํ•ด ์„œ๋ฒ„๋กœ๋ถ€ํ„ฐ ์—ญ์ „ํŒŒ๋œ ๊ทธ๋ž˜๋””์–ธํŠธ๋ฅผ ๊ธฐ๋‹ค๋ ค์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์—ฌ์ „ํžˆ ์ƒ๋‹นํ•œ ์‹œ๊ฐ„ ์ง€์—ฐ์ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค.

๋˜ํ•œ, ํ†ต์‹  ๋ถ€๋‹ด์€ ๋กœ์ปฌ ๋ฐ์ดํ„ฐ์…‹์˜ ํฌ๊ธฐ์™€ ์ž˜๋ผ๋‚ธ ๋ ˆ์ด์–ด์˜ ํ™œ์„ฑํ™”/๊ทธ๋ž˜๋””์–ธํŠธ ๋ชจ์–‘๊ณผ ๊ฐ™์€ ๋‹ค์–‘ํ•œ ์š”์†Œ์— ๋”ฐ๋ผ ์—ฌ์ „ํžˆ ํด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” ๋ถ„ํ•  ํ•™์Šต์— ํŠนํ™”๋œ ๋กœ์ปฌ ์†์‹ค ๊ธฐ๋ฐ˜ ํ›ˆ๋ จ์„ ํ†ตํ•ด ํด๋ผ์ด์–ธํŠธ/์„œ๋ฒ„ ์ธก ๋ชจ๋ธ์„ ๋ณ‘๋ ฌ๋กœ ์—…๋ฐ์ดํŠธํ•˜๋Š” ์ƒˆ๋กœ์šด ๋ฐฉํ–ฅ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค.

๋ถ„ํ• ๋œ ๋ชจ๋ธ์˜ ๋ณ‘๋ ฌ ํ›ˆ๋ จ์€ ์ง€์—ฐ ์‹œ๊ฐ„์„ ํฌ๊ฒŒ ๋‹จ์ถ•ํ•˜๋ฉด์„œ ์„œ๋ฒ„์™€ ํด๋ผ์ด์–ธํŠธ ๊ฐ„์˜ ํ†ต์‹ ์„ ์—†์• ์ค๋‹ˆ๋‹ค.

์šฐ๋ฆฌ๋Š” ์ตœ์ ์˜ ๋ชจ๋ธ ๋ถ„ํ• ์„ ์ด๋Œ์–ด๋‚ด๋Š” ์ง€์—ฐ ์‹œ๊ฐ„ ๋ถ„์„๊ณผ ๋ชจ๋ธ ๋ถ„ํ• ์— ๋Œ€ํ•œ ์ผ๋ฐ˜์ ์ธ ์ง€์นจ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๋˜ํ•œ, ์ˆ˜๋ ด์„ ๋ณด์žฅํ•˜๊ณ  ๋‹ค์–‘ํ•œ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ์™€ ์‹œ์Šคํ…œ ์ œ์•ฝ ์กฐ๊ฑด ๊ฐ„์˜ ์ƒํ˜ธ ์ž‘์šฉ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ์ด๋ก ์  ๋ถ„์„์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๊ด‘๋ฒ”์œ„ํ•œ ์‹คํ—˜ ๊ฒฐ๊ณผ๋Š” ์šฐ๋ฆฌ์˜ ๋ฐฉ์‹์ด ๊ธฐ์กด์˜ FL ๋ฐ SL ์•„์ด๋””์–ด๋ณด๋‹ค ํ†ต์‹  ๋ฐ ์ง€์—ฐ ์‹œ๊ฐ„์—์„œ ์ƒ๋‹นํ•œ ์ด์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ์Œ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

INTRODUCTION

์—ฐํ•ฉ ํ•™์Šต(FL) (McMahan et al., 2017; Koneฤnแปณ et al., 2016b;a; Li et al., 2020)์€ ํด๋ผ์ด์–ธํŠธ๊ฐ€ ๋ฐ์ดํ„ฐ๋ฅผ ์„œ๋ฒ„์— ์ง์ ‘ ์—…๋กœ๋“œํ•˜์ง€ ์•Š๊ณ ๋„ ๊ธ€๋กœ๋ฒŒ ๋ชจ๋ธ์„ ๊ณต๋™์œผ๋กœ ํ›ˆ๋ จํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋Š” ์œ ๋งํ•œ ๋ถ„์‚ฐ ํ•™์Šต ๋ฐฉํ–ฅ์œผ๋กœ ๊ฐ„์ฃผ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ FL์—์„œ๋Š” ๊ฐ ํด๋ผ์ด์–ธํŠธ๊ฐ€ ๋ฐ˜๋ณต์ ์œผ๋กœ ์„œ๋ฒ„์—์„œ ์ „์ฒด ๋ชจ๋ธ์„ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ , ๋ชจ๋ธ์„ ์—…๋ฐ์ดํŠธํ•œ ํ›„ ๋‹ค์‹œ ์„œ๋ฒ„๋กœ ์—…๋กœ๋“œํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ FL์˜ ํ›ˆ๋ จ ๊ณผ์ •์€ ํŠนํžˆ ๋งŽ์€ ์ˆ˜์˜ ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง์—์„œ ์ƒ๋‹นํ•œ ๊ณ„์‚ฐ/ํ†ต์‹  ๋ถ€๋‹ด์„ ์ดˆ๋ž˜ํ•ฉ๋‹ˆ๋‹ค. ๊ฒŒ๋‹ค๊ฐ€ ํด๋ผ์ด์–ธํŠธ์˜ ๊ณ„์‚ฐ ๋Šฅ๋ ฅ๊ณผ ์ „์†ก ์†๋„๊ฐ€ ๋‚ฎ์„ ๋•Œ(์˜ˆ: ๋ชจ๋ฐ”์ผ/IoT ์žฅ์น˜), FL์€ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๋Š” ๋ฐ ์ƒ๋‹นํ•œ ์‹œ๊ฐ„ ์ง€์—ฐ์„ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋Š” ๋‚ฎ์€ ๊ณ„์‚ฐ ๋Šฅ๋ ฅ๊ณผ ๋‚ฎ์€ ์ „์†ก ์†๋„๋ฅผ ๊ฐ€์ง„ ํด๋ผ์ด์–ธํŠธ์˜ ๋กœ์ปฌ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋Œ€๊ทœ๋ชจ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•˜๋ ค๋Š” ์‹ค์ œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ FL์˜ ์ ์šฉ์„ ์ œํ•œํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์Šคํ”Œ๋ฆฟ ๋Ÿฌ๋‹(SL) (Gupta & Raskar, 2018; Vepakomma et al., 2018; Singh et al., 2019; Koda et al., 2020; Thapa et al., 2020)์€ ์ด ์„ค์ •์„ ์œ„ํ•œ ๋˜ ๋‹ค๋ฅธ ์ตœ๊ทผ ์ ‘๊ทผ ๋ฐฉ์‹์œผ๋กœ, ํ›ˆ๋ จ์ด ์‹œ์ž‘๋˜๊ธฐ ์ „์— ๋ชจ๋ธ w๋ฅผ ๋‘ ๋ถ€๋ถ„์œผ๋กœ ๋‚˜๋ˆ„์–ด ํด๋ผ์ด์–ธํŠธ์˜ ๊ณ„์‚ฐ ๋ถ€๋‹ด์„ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฒซ ๋ช‡ ๊ฐœ์˜ ๋ ˆ์ด์–ด(ํด๋ผ์ด์–ธํŠธ ์ธก ๋ชจ๋ธ wC)๋Š” ํด๋ผ์ด์–ธํŠธ์— ํ• ๋‹น๋˜๊ณ , ๋‚˜๋จธ์ง€ ๋ ˆ์ด์–ด(์„œ๋ฒ„ ์ธก ๋ชจ๋ธ wS)๋Š” ์„œ๋ฒ„์— ํ• ๋‹น๋ฉ๋‹ˆ๋‹ค. ๊ฐ ํด๋ผ์ด์–ธํŠธ๋Š” ๋ชจ๋ธ์˜ ์ฒซ ๋ช‡ ๊ฐœ ๋ ˆ์ด์–ด๋งŒ ํ›ˆ๋ จํ•˜๋ฉด ๋˜๋ฏ€๋กœ, FL์— ๋น„ํ•ด ๊ฐ ํด๋ผ์ด์–ธํŠธ์˜ ๊ณ„์‚ฐ ๋ถ€๋‹ด์ด ์ค„์–ด๋“ญ๋‹ˆ๋‹ค.

๊ทธ๋Ÿฌ๋‚˜ ๊ธฐ์กด์˜ SL ๊ธฐ๋ฐ˜ ์•„์ด๋””์–ด๋Š” ์—ฌ์ „ํžˆ ์ง€์—ฐ ์‹œ๊ฐ„๊ณผ ํ†ต์‹  ํšจ์œจ์„ฑ ์ธก๋ฉด์—์„œ ๋‘ ๊ฐ€์ง€ ์ค‘์š”ํ•œ ๋ฌธ์ œ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ฒซ์งธ, ๊ธฐ์กด์˜ SL ์†”๋ฃจ์…˜์€ ๊ฐ ์ฐธ์—ฌ ํด๋ผ์ด์–ธํŠธ๊ฐ€ ๋ชจ๋ธ์„ ์—…๋ฐ์ดํŠธํ•˜๊ธฐ ์œ„ํ•ด ์„œ๋ฒ„๋กœ๋ถ€ํ„ฐ ์—ญ์ „ํŒŒ๋œ ๊ทธ๋ž˜๋””์–ธํŠธ๋ฅผ ๊ธฐ๋‹ค๋ ค์•ผ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์—ฌ์ „ํžˆ ์ƒ๋‹นํ•œ ์‹œ๊ฐ„ ์ง€์—ฐ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ฐ ๊ธ€๋กœ๋ฒŒ ๋ผ์šด๋“œ์—์„œ ์—…๋งํฌ/๋‹ค์šด๋งํฌ ํ†ต์‹ ์„ ํ†ตํ•ด ์ „๋‹ฌ๋˜๋Š” ์ˆœ๋ฐฉํ–ฅ/์—ญ๋ฐฉํ–ฅ ์‹ ํ˜ธ์— ๋Œ€ํ•œ ํ†ต์‹  ๋ถ€๋‹ด๋„ ์—ฌ์ „ํžˆ ์ƒ๋‹นํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ธฐ์—ฌ: ์ด ๋…ผ๋ฌธ์—์„œ๋Š” ๊ณ„์‚ฐ, ํ†ต์‹ , ์ง€์—ฐ ์‹œ๊ฐ„์˜ ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ์ž์›์„ ๋™์‹œ์— ์ค„์ด๋Š” ๋ถ„์‚ฐ ํ•™์Šต์„ ์œ„ํ•œ ์ƒˆ๋กœ์šด ๋ฐฉํ–ฅ์„ ์ œ์‹œํ•˜์—ฌ FL/SL์„ ๋ณด๋‹ค ๋น ๋ฅด๊ณ  ํ†ต์‹ -๊ณ„์‚ฐ ํšจ์œจ์ ์œผ๋กœ ๋งŒ๋“œ๋Š” ์†”๋ฃจ์…˜์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์Šคํ”Œ๋ฆฟ ๋Ÿฌ๋‹์—์„œ์™€ ๊ฐ™์ด ์ „์ฒด ๋ชจ๋ธ์„ ํด๋ผ์ด์–ธํŠธ ์ธก๊ณผ ์„œ๋ฒ„ ์ธก ๋ชจ๋ธ๋กœ ๋ถ„ํ• ํ•˜์—ฌ ํด๋ผ์ด์–ธํŠธ์˜ ๊ณ„์‚ฐ ๋ถ€๋‹ด์„ ์ค„์ž…๋‹ˆ๋‹ค. ํ˜„์žฌ FL ๋ฐ SL ์ ‘๊ทผ ๋ฐฉ์‹์˜ ๋†’์€ ํ†ต์‹  ์ž์› ์š”๊ตฌ ์‚ฌํ•ญ๊ณผ ๋†’์€ ์ง€์—ฐ ์‹œ๊ฐ„ ์š”๊ตฌ ์‚ฌํ•ญ์„ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด, ์Šคํ”Œ๋ฆฟ ๋Ÿฌ๋‹ ์„ค์ •์— ๋งค์šฐ ์ ํ•ฉํ•œ ๋กœ์ปฌ ์†์‹ค ๊ธฐ๋ฐ˜ ํ›ˆ๋ จ ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ํด๋ผ์ด์–ธํŠธ ์ธก ๋ชจ๋ธ์„ ์„œ๋ฒ„๋กœ๋ถ€ํ„ฐ ์—ญ์ „ํŒŒ๋œ ์‹ ํ˜ธ๋ฅผ ๋ฐ›์ง€ ์•Š๊ณ ๋„ ์—…๋ฐ์ดํŠธํ•  ์ˆ˜ ์žˆ๋„๋ก ํด๋ผ์ด์–ธํŠธ ์ธก ๋ฐ ์„œ๋ฒ„ ์ธก ๋กœ์ปฌ ์†์‹ค์ด๋ผ๋Š” ๋‘ ๊ฐ€์ง€ ๋‹ค๋ฅธ ๋กœ์ปฌ ์†์‹ค ํ•จ์ˆ˜๋ฅผ ๋„์ž…ํ•˜์—ฌ ํ†ต์‹  ํšจ์œจ์„ฑ๊ณผ ์ง€์—ฐ ์‹œ๊ฐ„์„ ํฌ๊ฒŒ ๊ฐœ์„ ํ•ฉ๋‹ˆ๋‹ค. Fig. 1์€ ์šฐ๋ฆฌ์˜ ์ ‘๊ทผ ๋ฐฉ์‹์„ FL ๋ฐ ์ตœ์‹  SL ์•„์ด๋””์–ด์ธ SplitFed (Thapa et al., 2020)์™€ ๋น„๊ตํ•ฉ๋‹ˆ๋‹ค. ์šฐ๋ฆฌ์˜ ์ฃผ์š” ๊ธฐ์—ฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์š”์•ฝ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค: