No seguimento do lançamento do Microsoft Fabric, o OneLake é o componente core em que assenta a abordagem lake-centric do Fabric. A Microsoft chama-lhe: “The OneDrive for data”.
Cada Microsoft Fabric tenant inclui automaticamente um OneLake, um data lake integrado e abrangente que serve a toda a organização… Um tenant, OneLake.
Providencia um data lake para toda a organização, uma cópia dos dados a serem utilizados em vários motores analíticos, e um modelo de segurança que vive nativamente com os dados no lake.
Ter um único data lake é o objetivo de todas as organizações. No entanto, a realidade é que, na maioria dos casos, e por muitas razões, as organizações criam vários lakes para diferentes grupos empresariais, em vez de terem um único lake e trabalhar nele.
Esta abordagem cria silos e, consequentemente, as empresas criam soluções complexas para a movimentação de dados, a fim de facilitar a partilha e a reutilização, o que conduz frequentemente a dados duplicados e, por vezes, dessincronizados.
O objetivo do OneLake é enfrentar estes desafios melhorando a colaboração.
Podem ser criados vários espaços de trabalho (workspaces) num tenant, facilitando a distribuição da propriedade dos dados e as políticas de acesso em diferentes segmentos da organização. Os workspaces estão associados a regiões específicas e são faturados separadamente como parte da sua capacidade dedicada. Se os dados tiverem restrições quanto à sua localização (devido por exemplo ao RGDP), o Fabric garante que os dados permanecerão na região do workspace, embora continuem a fazer parte do mesmo data lake lógico.
Mesmo as organizações que utilizam padrões como data mesh, com responsáveis de negócio independentes que seguem uma abordagem domain-driven, podem organizar e gerir eficazmente os seus dados definindo domínios, classificando workspaces e tendo um controlo mais granular sobre a forma como os dados de cada domínio podem ser consumidos.
O Fabric introduz uma característica notável chamada “shortcuts” para facilitar a partilha de dados. Os Shortcuts permitem que as organizações estabeleçam conexões de dados entre business domains sem a necessidade de movimentação de dados. Shortcuts referenciam os dados armazenados noutra localização no OneLake, num workspace diferente ou mesmo fora do OneLake, como ADLS ou S3. Do ponto de vista do utilizador final, é como se os dados estivessem armazenados localmente e podem integrar-se perfeitamente com outros dados, permitindo a sua utilização em vários motores analíticos. Os Shortcuts aplicam o RBAC em dois pontos, no workspace onde os shortcuts residem e no workspace onde estão os dados referenciados.
Nos bastidores, o OneLake é composto por várias contas de armazenamento ADLS Gen2 criadas e geridas pelo Fabric e virtualizadas num único data lake. O Fabric trata da complexidade da configuração destes armazenamentos para que as organizações se possam concentrar nos dados e na sua governação, que é o mais importante. Esta é uma das vantagens mais significativas dos serviços SaaS.
Para os interessados, encorajamos a explorar o Microsoft Fabric ou a contactar a BI4ALL para determinar se esta solução transformadora se alinha com as necessidades específicas da sua organização.